본문 바로가기
ADP 준비/통계

ADP 통계 문제 및 연습(제 23회차)

by BA815 2023. 2. 15.
728x90
반응형

제 23회차 통계문제 

 

문제 1. 공장에서는 진공관 수명이 1만 시간이라고 주장하여 품질관리팀에서 12개 샘플을 뽑았음 유의수준 5%에서 부호 검정하시오

데이터 출처 : https://raw.githubusercontent.com/Datamanim/datarepo/main/adp/23/problem2.csv

 

1. 귀무가설 연구가설 세우시오 

귀무가설 : 데이터의 중위수는 1만 시간이다 / 연구가설 : 데이터의 중위수는 1만 시간이 아니다

 

2. 유효한 데이터의 숫자는?

8개(중위수 검정에서 중위수와 동일한 값은 유효데이터 x이므로)

 

3. 검정통계량 및 연구 가설 채택 여부를 작성하라

library(data.table)
df <- fread("데이터 위치\\problem2.csv")

df_filtered <- subset(df, lifespan != 10000)
cat('중위수와 동일한 값들은 순위 부호 검정에서 불필요한 데이터이다. 그 숫자는:', 
nrow(subset(df, lifespan == 10000)), '\n')

# 3. 검정통계량 및 연구 가설 채택 여부 작성
library(stats)
result <- wilcox.test(df_filtered$lifespan - 10000)
static <- result$statistic
pvalue <- result$p.value
cat('검정통계량은', static, '이다. pvalue는', pvalue, 
    '로 5% 유의 수준에서 귀무가설을 기각할 수 없다. 연구가설을 채택하지 않는다.\n')

--> 검정통계량은 8.5 이다. pvalue는 0.207021 로 5% 유의 수준에서 귀무가설을 기각할 수 없다. 연구가설을 채택하지 않는다.

 

문제 2. 아래 이미지와 같은 학과별 학점 분포 인원수 표가 있다. 학과와 성적이 관계있는지를 검정하라

1. 귀무가설 연구가설 세우기

귀무가설 : 학과와 성적은 관련이 없다 (독립이다) / 연구가설 : 학과와 성적은 관련이 있다 (독립이 아니다)

 

2. 학과와 성적이 독립일 경우의 기댓값을 구하시오

df <- data.frame('사회과학'=c(15,60,24),'자연과학'=c(25,69,5),'공학'=c(10,77,13))
row.names(df) <- c('1.5-2.5','2.5-3.5','3.5-4.5')

# 2. 학과와 성적이 독립일 경우의 기댓값을 구하시오
library(stats)
res <- chisq.test(df)
expected <- res$expected
print(expected)

output값

3. 검정통계량 및 연구 가설 채택 여부를 작성하라

# 3. 검정 통계량 및 연구 가설 채택 여부를 작성하라 
p_value <- res$p.value
print(p_value)

# 카이 제곱 검정시 p-value는 0.00018로 귀무가설을 기각한다. 학과와 성적은 관련이 있다.
# 만약 5보다 작은 셀이 20%가 넘어 간다면(75%) 피셔의 정확검정을 사용 해야한다.
# fisher.test(df)

output값

 

728x90
반응형

'ADP 준비 > 통계' 카테고리의 다른 글

ADP 통계 문제 및 연습(제 22회차)  (0) 2023.02.05

댓글