통계학 기초 – 4. 독립성 결합확률 주변확률 조건부 확률

오늘은 통계학 기초 4번째 포스팅으로 독립성과 연관성에 대해 이야기해보려 합니다.



배반성 vs 독립성

통계학에서 자주 쓰이는 용어인 독립성에 대해서 알아보겠습니다.

처음 통계학을 접한다면 배반성의 개념에 헷갈리는 경우가 있는데, 배반성에 대해 먼저 간단히 설명하고 넘어가도록 하겠습니다.

배반성

배반성과 독립성은 공통점이 있는데, 둘 이상의 사상(event)이 아무런 연관이 없다는 것입니다.

하지만 그 부분을 조금 더 자세히 본다면 차이가 분명히 존재하는데요,

독립성과 배반성의 차이에 대한 이해를 돕기 위해 사건 A와 B를 예시로 들고 있는 사진

사건 A, B가 있다고 가정하면, 배반성은 그 두 사건은 절대 동시에 일어나지 않음을 의미합니다.

동전 던지기를 예시로 들어보겠습니다.

동전을 한 번 던졌을 때, 앞면이 나오는 사건을 사건 A, 뒷면이 나오는 사건을 사건 B라고 하면,

사건 A와 사건 B는 동시에 일어날 수 없습니다.

즉, 이 두 사건은 상호 배제적(Mutually Exclusive) 임을 의미합니다.

수식을 통해 좀 더 자세히 보겠습니다.

배반성의 이해를 돕기 위한 사진 자료

여기서 사건 A와 사건 B의 교집합이 0이 되는 사건은 배반사건이 되는 것입니다.

독립성

독립성은 사건 A의 발생 여부와 상관없이 사건 B가 발생하는 것을 의미합니다.

K라는 사람이 동창회에 가려고 하는데, 동창회장에게 연락이 왔습니다.

동창회장: 너 동창회 참석할거야?

K: 응, 나가려고 왜?

동창회장: 네 전 여친인 L도 나온대.

K: 뭔 상관이야, 어차피 나가려고 했어.

K는 L이 동창회에 나오든 말든 본인은 동창회에 나가려고 했기 때문에 K가 동창회에 나오는 사건과 L이 동창회에 나오는 사건은 독립입니다.

만약, 여기서 K가 L이 동창회에 나온다는 소식을 듣고 나가지 않겠다고 말한다면, 그리고

L 역시 K가 동창회에 나온다는 소식을 듣고 나가지 않겠다고 말한다면 K가 동창회에 나오는 사건과 L이 동창회에 나오는 사건이 배반이 되겠죠.

이 두 사건은 동시에 일어날 수 없기 때문입니다.

결합확률과 주변확률

결합확률(Joint probability)은 사건 간의 교집합으로 표현됩니다.

사건 A와 E의 경우, 전체 690개의 경우의 수 중 사건 A와 E가 동시에 발생할 건 수가 97이므로

사건 A와 E의 결합확률 P(A∩E) = 97/690 = 0.140입니다.

주변확률(Marginal Probability)은 결합확률의 합으로 표현될 수 있습니다.

위의 사진에서 사건 E와 사건 A,B,C,D가 동시에 일어날 각각의 확률을 더했을 때 표현되는 행의 합을 보시면 됩니다.

결합확률이 주변확률의 곱으로 표현된다면 그 두 사건은 독립입니다.

위의 사진에서는 없는 경우이지만,

사건 A와 E에 대해 1행의 합인 0.501과 1열의 합인 0.339를 곱하였을 때의 값이 사건 A와 E의 결합확률로 표현된다면 사건 A와 E는 독립이라고 할 수 있습니다.

이 내용은 아래 조건부 확률 이야기를 다루면서 보다 자세히 증명과 함께 설명드리겠습니다.

조건부 확률

개념

결합확률과 주변확률에 대해 이해를 하셨다면, 조건부 확률 역시, 쉽게 이해하실 수 있습니다.

조건부 확률이란, 어떤 사건이 발생했을 때, 특정 사건이 발생할 확률입니다.

사건 E가 발생하였을 때, 사건 A가 발생할 확률을 구한다고 한다면,

사건 E가 발생할 확률 0.501을 분모에, 사건 A와 E가 동시에 발생할 확률 0.140을 분자로 둡니다.

분모가 1이 아닌 이유는 조건부 확률에서 사건 E가 발생한다고 가정하였기 때문입니다.

그렇게 하면 사건 A와 E의 조건부 확률을 쉽게 구하실 수 있습니다.

조건부 확률을 이용한 증명

위에서 결합확률이 주변확률의 곱으로 표현된다면 그 두 사건은 독립이라고 했습니다.

그 이유를 간단한 증명을 통해 보이겠습니다.

  • P(A|B)P(B|A)는 사건 A와 B가 독립이라고 하면, 각각 P(A)P(B)로 표현됩니다.
  • 처음 식에 의해 P(A∩B) P(A|B)*P(B)P(B|A)*P(A)로 표현됩니다.

위의 두 식을 연립하면 결국 P(A)*P(B)와 P(B)*P(A)가 되고 이는 같은 값을 지닙니다.

함께 보면 좋은 글들

Leave a Comment