[파이썬을 활용한 통계 개념 기초] 09. 음이항 분포(Negative binomial distribution)통계/파이썬을 이용한 통계 기초2024. 10. 17. 08:30
Table of Contents
음이항 분포(Negative binomial distribution)
음이항 분포(Negative Binomial Distribution)의 개념
음이항 분포는 이항 분포의 확장된 개념으로, 특정한 사건(성공)이 r번 일어날 때까지 실패가 몇 번 일어나는지에 대한 확률 분포입니다. 이 분포는 베르누이 시행의 반복으로 이루어집니다.
주요 개념
- 이항 분포(Binomial Distribution): 성공/실패 두 가지 결과만 있는 베르누이 시행을 n번 반복했을 때, r번 성공할 확률을 나타냅니다. 시행 횟수 n은 고정되어 있습니다.
- 음이항 분포: r번 성공할 때까지 시행되는 베르누이 시행의 실패 횟수에 대한 분포를 나타냅니다. 이때, 성공 횟수 r은 고정되어 있지만, 시행 횟수 n은 고정되지 않습니다.
수식
음이항 분포의 확률 질량 함수(PMF)는 다음과 같이 정의됩니다.
- r: 성공해야 하는 횟수 (고정)
- p: 성공할 확률
- x: 실패 횟수
이 수식은 조합(Combination)을 통해 표현되며, 음이항 분포의 시행은 마지막에 항상 성공으로 끝난다는 조건이 있습니다.
음이항 분포의 사용 예
음이항 분포는 성공이 반복적으로 나타나는 상황에서 유용하게 사용됩니다. 예를 들어, 동전을 던져서 r번 앞면이 나올 때까지 던지는 횟수에서 실패(뒷면)가 발생하는 횟수를 모델링할 때 사용할 수 있습니다.
음이항 분포와 이항 분포의 차이점
- 이항 분포는 성공 횟수에 대해 정의되며, 시행 횟수 n이 고정되어 있습니다.
- 음이항 분포는 성공할 때까지의 시행 횟수가 변동되며, 실패 횟수에 대해 정의됩니다.
관련 분포
- 기하 분포(Geometric Distribution): 음이항 분포의 특수한 경우로, r = 1일 때를 말합니다. 즉, 첫 번째 성공이 나올 때까지의 실패 횟수를 모델링합니다.
- 초기하 분포(Hypergeometric Distribution): 고정된 크기의 모집단에서 성공/실패를 구분하여 비복원 추출을 하는 경우에 사용하는 분포입니다.
음이항 분포의 직관적 이해
음이항 분포는 현실에서 자주 접할 수 있습니다.
예를 들어:
- 마케팅 캠페인에서 10번 성공적인 고객 반응을 얻을 때까지 몇 번의 실패가 발생하는지를 모델링할 수 있습니다.
- 머신러닝 모델의 하이퍼파라미터 튜닝 과정에서, 원하는 성능을 달성할 때까지 몇 번의 실패를 경험하는지를 모델링할 수 있습니다.
음이항 분포를 사용한 데이터 분석
음이항 분포는 데이터 분석에서 과산포(Overdispersion) 문제를 해결하는 데 유용합니다. 과산포는 실제 데이터에서 분산이 평균보다 큰 경우에 발생하는데, 이항 분포가 이러한 상황을 적절히 설명하지 못할 때 음이항 분포를 사용하여 더 적합한 모델링을 할 수 있습니다.
과산포 예시
- 고객 이탈(Churn) 분석에서, 특정 조건에 따라 이탈 확률이 높아지거나 낮아지는 경우, 음이항 분포를 사용해 이러한 변동성을 모델링할 수 있습니다.
음이항 분포의 활용
음이항 분포는 여러 가지 실제 문제에 사용되며, 특히 반복적인 실패/성공을 다루는 상황에서 중요하게 사용됩니다.
이를 통해 현실 세계의 확률 변수를 더 잘 설명할 수 있습니다.
728x90
'통계 > 파이썬을 이용한 통계 기초' 카테고리의 다른 글
[파이썬을 활용한 통계 개념 기초] 11. 독립(Independence) (0) | 2024.10.31 |
---|---|
[파이썬을 활용한 통계 개념 기초] 10. 기댓값(Expectation) (1) | 2024.10.24 |
[파이썬을 활용한 통계 개념 기초] 08. 근사(Approximation) (0) | 2024.10.10 |
[파이썬을 활용한 통계 개념 기초] 07. 표준화와 정규화(Standardization and Normalization) (0) | 2024.10.05 |
[파이썬을 활용한 통계 개념 기초] 06. 포아송 분포(Poisson distribution) (0) | 2024.09.24 |
@ourkofe's story :: ourkofe
데이터 분석을 공부하고 카페를 열심히 돌아다니는 이야기
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!