통계학 기초 – 3. 통계적 검정과 가설, p-value



안녕하세요, 이번 포스팅에서는 통계적 검정에 대해서 이야기해보려 합니다. 통계적 검정과 가설, 그리고 가설 검정에서 쓰이는 p-value에 대해서 알아보도록 하겠습니다.

목차

통계적 검정

통계적 검정이란 모집단에서 추출한 표본에 대해 조사를 진행, 조사 결과를 모집단에 적용하는 과정입니다.

통계적 검정에 대한 이해를 돕기 위한 사진
표본 간 조사 결과를 비교 = 모집단 간 통계적 검정

예를 들어, 동전을 던진다고 생각해봅시다. 모집단은 동전을 던지는 행위로 그 횟수는 무한입니다.

이 조사에서는 모집단이 무한 모집단이 되는 것이지요.

우리가 동전을 10번 던졌을 때, 동전이 모두 앞면이 나왔다고 가정해봅시다.

그럼 우리가 이 동전을 앞면만 나오는 동전이라고 생각할 수 있을까요 ?

30번, 50번, 100번을 던졌을 때도 앞면만 나온다면 어떨까요 ?

몇 번을 던져서 모두가 앞면이 나왔을 때, 우리가 이 동전을 앞면만 나오는 동전이라고 판단할 수 있을까요 ?

이에 대한 기준을 제시하는 것이 바로 통계적 검정입니다.

통계적 검정에서는 맞다, 아니다 등의 표현을 사용하지 않습니다.

유의하다 혹은 유의하지 않다 등의 표현을 사용합니다.

통계적 검정 자체가 표본에 대한 모집단의 일반화를 통한 예측이지, 사실이 아니기 때문입니다.

대한민국 남자 전체 키 평균이 궁금해서 표본으로 1000명을 뽑았다고 가정해봅시다.

이 때, 표본으로 조사한 2020년 대한민국 남자 키 평균이 165이고, 2022년에는 167입니다.

이게 통계적으로 차이가 있을까요 ? 물론 있습니다. 2만큼 차이나기 때문이죠,

근데 그건 표본에서의 차이일 뿐이고, 우리가 궁금한 것은 모집단에서 2만큼의 차이가 유의한가입니다.

통계학이라는 학문 자체가 모집단을 알고자 하는 학문이기 때문입니다.

가설 검정

귀무가설과 대립가설

가설에는 귀무가설(null hypothesis)과 대립가설(alternative hypothesis)이 존재합니다.

위의 예시를 통해서 설명해드리겠습니다.

대한민국 남자 전체 키 평균이 궁금해서 표본으로 1000명을 뽑았다고 가정해봅시다.

이 때, 표본으로 조사한 2020년 대한민국 남자 키 평균이 165이고, 2022년에는 167입니다.

우리는 대한민국 남자의 평균 키가 증가한 것인지 궁금합니다. 이 때 가설을 통한 검정을 진행하게 됩니다.

우리가 주장하고자 하는 내용을 대립가설로 설정합니다.

H1: 2020년과 2022년의 대한민국 남자 키 평균의 차이가 있다. (𝜇>165) -> 대립가설

H0: 2020년과 2022년의 대한민국 남자 키 평균의 차이가 없다. (𝜇=165) -> 귀무가설

이렇게 가설 설정을 마쳤으면 우리는 이제 이 가설에 대한 검정을 진행해야합니다.

평균의 차이를 검정하기 위해서는 T분포 검정을 사용하는데, 이 내용은 이후에 자세히 다루도록 하겠습니다.

아무튼! 모든 검정의 결과에 대해서는 ‘p-value’라는 유의확률 값을 이용하게 됩니다.

p-value

p-value는 귀무가설 하에서 표본과 같은 상황이 발생할 확률입니다.

이 때, p-value가 유의수준을 기준으로 유의수준보다 작게 되면 우리는 귀무가설을 기각하게 됩니다.

예를 들어 계산한 p-value가 0.03이라고 한다면, 귀무가설이 참일 가능성이 3% 존재한다는 것입니다.

통계학에서는 유의수준을 대부분 0.05로 둡니다. 귀무가설이 참일 가능성이 5%정도는 봐주겠다는 거죠.

유의수준이 0.05인 이유는 그냥..

유의수준을 대부분 0.05로 두는 이유는 사진 속 주인공 로널드 피셔가 그렇게 정했기 때문이다.
로널드 피셔
(사진 출처: 나무위키)

이 사람이 그렇게 정했습니다. 세상에 완벽한 사실은 없다고 보고 5%의 오차 정도는 받아들이겠다는 뜻이죠.

예시

가설 검정에 대한 예시를 보여드리면서 이번 포스팅을 마무리하겠습니다.

송전탑과 송전선의 자기장이 소아 백혈병의 원인인지를 파악하기 위한 관찰연구가 있었습니다.

귀무가설: 송전탑과 송전선의 자기장은 소아 백혈병의 원인일 것이다.

대립가설: 송전탑과 송전선의 자기장은 소아 백혈병의 원인이 아닐 것이다.

조사에 들었던 시간과 비용: 5년, 500만불

조사대상: 소아 백혈병 환자 638명과 소아 백혈병 환자가 아닌 아이들 620명.

조사방식: 집집마다 방문하여 직접 침실과 현관 등에서의 자기장을 측정

또한, 현재 거주지와 아이 임신 시 거주지가 송전탑 근처였는지 여부를 확인

조사결과: p-value 값 = 0.312

p-value값은 0.312귀무가설을 기각하지 못한다는 결론이었습니다.

하지만, 이 결론을 통해 소아 백혈병과 자기장의 연관관계가 없다고는 단정지을 수는 없다는 것이죠.

약 30%는 표본에서 자기장이 소아 백혈병의 원인인 상황이 발생할 수 있기 때문입니다.

이러한 이유로 통계학에서 가설 검정의 결과를 ‘맞다, 아니다’로 결정할 수 없습니다.

함께 보면 좋은 글들

Leave a Comment