통계적 검정(Statistical test) 또는 가설검정(Hypothesis test)란, 표본 데이터를 기반으로 하여 우리가 관심을 가지는 모집단에 대한 새로운 주장이 옳고 그름을 확인하는 과정이다. 일반적으로 우리가 관심을 가지는 모든 모집단에 대한 정보를 확인하는 것에는 어려움이 있으므로, 모집단을 충분히 잘 대변해주는 것으로 판단되는 표본 데이터를 바탕으로 가설 검정을 수행하게 된다.
가설검정을 위해 사용하는 중요한 개념은 1) 귀무가설(Null Hypothesis)와 2) 대립가설(Alternative Hypothesis)이다.
1) 귀무가설
귀무가설이란 모집단에 대한 기존의 주장을 의미한다. 가설 검정에서는 귀무가설이 참이라는 가정 하에서 수행된다.
2) 대립가설
대립가설이란 모집단에 대한 새로운 주장을 의미한다. 일반적으로 새로운 주장의 경우 분명하게 입증되지 않을 경우 받아드려지기에 어려움이 있기 때문에 기존 주장이 명백하게 잘못되었다고 입증하는 절차를 거쳐야 하며, 이러한 입증 과정을 가설 검정이라고 한다.
가설검정을 위해서는 일반적으로 아래 절차에 따라 진행된다.
① 표본으로부터 검정하고자 하는 검정통계량(Test Statistics)을 계산한다. 이때 통계적 검정을 수행하기 위해서는 그 통계량의 분포를 알아야 한다. 다행히 일반적인 경우에 대한 통계량 분포는 알려져있다. 예를 들어 표본 평균이 검정통계량이라면 통계적 검정을 위해서는 표본평균의 분포를 알아야 하는데, 표본평균의 분포는 중심극한정리(Central Limit Theorem)에 의해 정규분포를 따르는 것으로 알려져 있다.
② 검정통계량과 그 분포를 토대로 우리는 P-Value를 계산할 수 있다. P-Value는 귀무가설이 참이라는 가정 하 우리가 관측한 통계량과 같거나 그보다 더 극단적인 값이 발생할 확률을 의미한다. P-Value는 유의확률(Significance probability)라고도 한다.
③ P-Value가 매우 작은 경우 우리는 귀무가설이 참이 아니라고 받아드리게 되어 귀무가설을 기각한다. 반면 P-Value의 값이 높다면(그다지 작지 않다면) 우리는 귀무가설을 기각할 충분한 근거가 없다고 판단하여 귀무가설을 기각하지 못한다.
P-Value가 매우 작아서 귀무가설을 기각할 수 있다고 이야기하기 위해서는 (매우 작다는 상대적인 개념이므로) 매우 작다의 기준을 정해야 한다. 일반적으로 학계에서는 5% 유의확률을 가장 많이 사용하며, 더 엄밀한 분석을 위해 1% 유의확률을 사용하는 경우도 있고, 조금 더 유연한 분석을 위해서는 10% 유의확률을 사용하기도 한다. 이에 대해서는 명확히 정의가 되어 있는 영역이라기보다는 자신이 통계적 검정을 수행하고자 하는 영역의 일반적인 Rule을 따라가면 된다.
위에서 서술한 바와 같이 우리는 통계적 검정을 수행하지만, 동시에 통계의 영역이기 때문에 우리가 틀리게 분석을 했을 수 있다. 이에 대해서는 제 1종 오류와 제 2종 오류로 구별하여 이야기를 할 수 있다. 1종 오류와 2종 오류에 대한 부분은 아래 그림을 참조하여 확인할 수 있다.
검정통계의 개념 및 제1종 오류, 제2종 오류에 대해 알고 나면, 연구자는 자신의 연구의 목적에 따라 유의수준을 지정할 수 있다. 왜냐면 여기에는 분명한 Trade-off 관계가 있기 때문이다. 예를 들어 유의 수준을 크게하면(귀무가설을 기각하기에 쉽게 한다면) 검정력은 증가한다. 또한 표본크기를 증가시키면 이에 따라 검정력이 커지게 된다. 그러나 유의수준을 지나치게 크게 하는 것은 동시에 가설검정의 신뢰도를 낮출 수 있으며, 표본크기를 너무 크게 하는 것은 일반적인 상황에서 비용을 크게 하게 된다. 따라서 연구자는 이러한 Trade-off 관계를 유의하여 자신의 효용을 최대로 할 수 있도록 해야한다.
'Business Analytics > R로 하는 통계검정' 카테고리의 다른 글
변수 변환 - log 변환, Exp 변환, 박스-콕스 변환(Box-Cox Transformation) (0) | 2023.01.02 |
---|---|
R 데이터 불균형 처리(imbalance data) (0) | 2022.11.20 |
R로 하는 비모수검정(Non parametric Statistics) (1) 독립표본 평균검정(윌콕슨 순위합 검정, 크러스칼-왈리스 검정, 프리드만 검정) (0) | 2022.09.12 |
댓글