독립(Independence)
독립은 확률 및 통계에서 매우 중요한 개념입니다. 통계를 다룰 때, 사건들이 서로 독립적인지 아니면 의존적인지를 판단하는 것이 매우 중요합니다.
독립을 이해하려면 먼저 조건부 확률(Conditional Probability) 개념을 알아야 합니다.
조건부 확률과 공식
조건부 확률은 한 사건이 주어진 상황에서 다른 사건이 발생할 확률을 의미합니다.
여기서:
- P(A∣B)는 사건 B가 발생한 상황에서 사건 A가 발생할 확률입니다.
- P(A∩B)는 사건 A와 B가 동시에 발생할 확률입니다.
- P(B)는 사건 B가 발생할 확률입니다.
이 공식은 사건 B가 발생한 조건에서 사건 A가 일어날 가능성을 계산하는 방법을 제시합니다.
독립의 정의
두 사건이 독립적이라는 것은, 한 사건의 발생이 다른 사건의 발생 확률에 영향을 미치지 않는다는 것을 의미합니다. 수학적으로 두 사건 A와 B가 독립적일 때는 다음과 같은 관계가 성립합니다:
즉, 사건 B가 발생했다는 정보가 사건 A의 발생 확률에 영향을 미치지 않는다는 뜻입니다. 예를 들어, 학생들의 평균 성적이 과제 제출 여부에 영향을 미치는지 확인하고 싶을 때, 성적이 과제 제출에 영향을 주지 않는다면 이 두 사건은 독립적이라고 할 수 있습니다.
독립의 예시
주사위를 던지는 예시를 통해 독립의 개념을 더 잘 이해할 수 있습니다. 공정한 6면체 주사위를 던질 때, 다음 두 사건을 가정해봅시다:
- 사건 A: 주사위의 눈이 짝수임.
- 사건 B: 주사위의 눈이 4 이상임.
이때 각 사건의 확률은 다음과 같습니다.
사건 A와 B가 동시에 일어날 확률 P(A∩B)는 주사위 눈이 4와 6일 때만 성립하므로:
그리고 조건부 확률 P(A | B)는
P(A|B)는 P(A)와 같지 않으므로, 이 두 사건은 독립적이지 않다는 결론을 내릴 수 있습니다.
즉, 사건 B가 발생했다는 정보가 사건 A의 발생 확률에 영향을 미치므로 이 두 사건은 종속적인 관계입니다.
확률 곱셈 정리 (Multiplication Rule for Independent Events)
독립 사건은 두 사건이 서로 영향을 주지 않으므로, 두 사건 A와 B가 동시에 발생할 확률은 각각의 확률을 곱한 값과 같습니다.
이를 곱셈 정리라고 하며, 수식으로 표현하면 다음과 같습니다.
P(A∩B)=P(A)×P(B)
이 공식은 두 사건이 독립일 때만 성립합니다. 예를 들어, 주사위를 두 번 던지는 경우 첫 번째 주사위에서 짝수가 나오고, 두 번째 주사위에서 4 이상이 나올 확률은 P(A)×P(B)로 계산됩니다.
독립성 검정 (Statistical Test for Independence)
통계적으로 두 사건이 독립적인지 검정하기 위해서는 카이제곱 독립성 검정을 사용할 수 있습니다. 이 검정은 두 범주형 변수가 독립적인지 여부를 판단하는데, 데이터를 교차표로 정리하고 카이제곱 통계량을 계산하여 독립 여부를 판단합니다.
또한, 상관계수(Correlation Coefficient)를 사용하여 두 변수 간의 상관관계를 측정하고, 상관계수가 0에 가까울수록 독립에 가까움을 나타낼 수 있습니다.
실제 사례 : 가격과 수요의 독립
실생활 예시로, 과일 가격과 수요 간의 관계를 살펴봅시다. 지역 과일의 평균 가격이 1만 원, 수입 과일의 평균 가격이 1만 2천 원이라고 가정해봅시다. 두 가격이 서로 독립적이라면 지역 과일 가격의 변화가 수입 과일 가격에 영향을 미치지 않아야 합니다. 그러나 지역 과일 가격이 수입 과일 가격에 영향을 미친다면, 이 두 변수는 독립적이지 않고 종속적이라고 할 수 있습니다. 즉, 수학적으로P(지역 과일 가격)≠P(수입 과일 가격)이 성립하면 이 두 변수는 종속 관계에 있다고 볼 수 있습니다.
'통계 > 파이썬을 이용한 통계 기초' 카테고리의 다른 글
[파이썬을 활용한 통계 개념 기초] 13. F 분포와 t 분포(F and t distribution) (0) | 2024.11.19 |
---|---|
[파이썬을 활용한 통계 개념 기초] 12. 표본 및 통계(Sample & statistic) (0) | 2024.11.06 |
[파이썬을 활용한 통계 개념 기초] 10. 기댓값(Expectation) (1) | 2024.10.24 |
[파이썬을 활용한 통계 개념 기초] 09. 음이항 분포(Negative binomial distribution) (1) | 2024.10.17 |
[파이썬을 활용한 통계 개념 기초] 08. 근사(Approximation) (0) | 2024.10.10 |
데이터 분석을 공부하고 카페를 열심히 돌아다니는 이야기
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!