728x90
반응형
제 23회차 통계문제
문제 1. 공장에서는 진공관 수명이 1만 시간이라고 주장하여 품질관리팀에서 12개 샘플을 뽑았음 유의수준 5%에서 부호 검정하시오
데이터 출처 : https://raw.githubusercontent.com/Datamanim/datarepo/main/adp/23/problem2.csv
1. 귀무가설 연구가설 세우시오
귀무가설 : 데이터의 중위수는 1만 시간이다 / 연구가설 : 데이터의 중위수는 1만 시간이 아니다
2. 유효한 데이터의 숫자는?
8개(중위수 검정에서 중위수와 동일한 값은 유효데이터 x이므로)
3. 검정통계량 및 연구 가설 채택 여부를 작성하라
library(data.table)
df <- fread("데이터 위치\\problem2.csv")
df_filtered <- subset(df, lifespan != 10000)
cat('중위수와 동일한 값들은 순위 부호 검정에서 불필요한 데이터이다. 그 숫자는:',
nrow(subset(df, lifespan == 10000)), '\n')
# 3. 검정통계량 및 연구 가설 채택 여부 작성
library(stats)
result <- wilcox.test(df_filtered$lifespan - 10000)
static <- result$statistic
pvalue <- result$p.value
cat('검정통계량은', static, '이다. pvalue는', pvalue,
'로 5% 유의 수준에서 귀무가설을 기각할 수 없다. 연구가설을 채택하지 않는다.\n')
--> 검정통계량은 8.5 이다. pvalue는 0.207021 로 5% 유의 수준에서 귀무가설을 기각할 수 없다. 연구가설을 채택하지 않는다.
문제 2. 아래 이미지와 같은 학과별 학점 분포 인원수 표가 있다. 학과와 성적이 관계있는지를 검정하라
1. 귀무가설 연구가설 세우기
귀무가설 : 학과와 성적은 관련이 없다 (독립이다) / 연구가설 : 학과와 성적은 관련이 있다 (독립이 아니다)
2. 학과와 성적이 독립일 경우의 기댓값을 구하시오
df <- data.frame('사회과학'=c(15,60,24),'자연과학'=c(25,69,5),'공학'=c(10,77,13))
row.names(df) <- c('1.5-2.5','2.5-3.5','3.5-4.5')
# 2. 학과와 성적이 독립일 경우의 기댓값을 구하시오
library(stats)
res <- chisq.test(df)
expected <- res$expected
print(expected)
3. 검정통계량 및 연구 가설 채택 여부를 작성하라
# 3. 검정 통계량 및 연구 가설 채택 여부를 작성하라
p_value <- res$p.value
print(p_value)
# 카이 제곱 검정시 p-value는 0.00018로 귀무가설을 기각한다. 학과와 성적은 관련이 있다.
# 만약 5보다 작은 셀이 20%가 넘어 간다면(75%) 피셔의 정확검정을 사용 해야한다.
# fisher.test(df)
728x90
반응형
'ADP 준비 > 통계' 카테고리의 다른 글
ADP 통계 문제 및 연습(제 22회차) (0) | 2023.02.05 |
---|
댓글