통계/파이썬을 이용한 통계 기초2024. 11. 22. 08:55[파이썬을 활용한 통계 개념 기초] 14. 카이제곱 분포(Chi-squared distribution)

카이제곱 분포 (Chi-squared Distribution)카이제곱 분포는 주로 통계적 가설 검정에서 빈번하게 사용되는 분포로, 모집단의 분산에 대한 검정을 가능하게 합니다.일반적으로 χ2 로 표기되며, 표준 정규 분포의 제곱 합을 통해 만들어집니다. 이 분포는 특히 모집단의 분산 추정이나 독립성 검정에서 중요한 역할을 하며, 통계 이론과 실무에서 모두 필수적인 도구로 여겨집니다.정의와 수학적 배경카이제곱 분포는 여러 독립적인 표준 정규 분포를 따르는 변수들의 제곱합으로 정의됩니다.예를 들어,X1,X2,…,Xn이 각각 독립적으로 N(0,1^2)인 표준 정규 분포를 따른다면, 이 변수들의 제곱을 더한 값 Y는 자유도 n을 가지는 카이제곱 분포를 따르게 됩니다.여기서 n은 자유도(Degrees of Fre..

통계/파이썬을 이용한 통계 기초2024. 11. 19. 10:56[파이썬을 활용한 통계 개념 기초] 13. F 분포와 t 분포(F and t distribution)

F 분포와 t 분포의 이해F 분포 (F-distribution)1. 정의 F 분포는 두 독립적인 카이제곱 분포의 비율에서 유도됩니다. 만약 \(X_1\)과 \(X_2\)가 각각 자유도가 \(u\)와 \(v\)인 카이제곱 분포를 따르고, 서로 독립적이라면 다음이 성립합니다.\[ X_1 \sim \chi^2(u), \quad X_2 \sim \chi^2(v), \quad \text{then} \quad \frac{X_1 / u}{X_2 / v} \sim F(u, v) \]여기서:\(u, v\): 각각의 자유도 (degrees of freedom)\(F(u, v)\): 자유도가 \(u, v\)인 F 분포2. 특징F 분포는 항상 양수 값을 가집니다. (\(F > 0\))비대칭적인 형태를 가지며, 자유도 \(u\..

[파이썬을 활용한 통계 개념 기초] 12. 표본 및 통계(Sample & statistic)
통계/파이썬을 이용한 통계 기초2024. 11. 6. 08:30[파이썬을 활용한 통계 개념 기초] 12. 표본 및 통계(Sample & statistic)

표본 및 통계모집단과 표본모집단(Population)은 연구의 관심 대상이 되는 전체 집단을 의미합니다. 예를 들어, 한국 20대가 특정 색상을 얼마나 좋아하는지 알고 싶다면, 한국 20대 전체가 모집단이 됩니다. 모집단은 우리가 연구하고자 하는 모든 대상이 포함된 집합으로, 이 안의 특성을 정확하게 파악할 수 있다면 모집단에 대해 확실한 결론을 내릴 수 있습니다.하지만 현실적으로 모든 개체를 조사하는 것은 불가능하거나 비효율적일 수 있습니다. 그래서 모집단의 특성을 추정하기 위해 일부 개체를 선택한 표본(Sample)을 사용합니다. 표본은 모집단을 대표할 수 있도록 선택해야 하며, 확률 표본(Random Sample)을 사용하는 것이 일반적입니다. 확률 표본을 통해 모집단의 모든 개체가 동일한 확률로 ..

[파이썬을 활용한 통계 개념 기초] 11. 독립(Independence)
통계/파이썬을 이용한 통계 기초2024. 10. 31. 08:30[파이썬을 활용한 통계 개념 기초] 11. 독립(Independence)

독립(Independence)독립은 확률 및 통계에서 매우 중요한 개념입니다. 통계를 다룰 때, 사건들이 서로 독립적인지 아니면 의존적인지를 판단하는 것이 매우 중요합니다.독립을 이해하려면 먼저 조건부 확률(Conditional Probability) 개념을 알아야 합니다.조건부 확률과 공식조건부 확률은 한 사건이 주어진 상황에서 다른 사건이 발생할 확률을 의미합니다.여기서:P(A∣B)는 사건 B가 발생한 상황에서 사건 A가 발생할 확률입니다.P(A∩B)는 사건 A와 B가 동시에 발생할 확률입니다.P(B)는 사건 B가 발생할 확률입니다.이 공식은 사건 B가 발생한 조건에서 사건 A가 일어날 가능성을 계산하는 방법을 제시합니다.독립의 정의두 사건이 독립적이라는 것은, 한 사건의 발생이 다른 사건의 발생 확..

[파이썬을 활용한 통계 개념 기초] 10. 기댓값(Expectation)
통계/파이썬을 이용한 통계 기초2024. 10. 24. 08:30[파이썬을 활용한 통계 개념 기초] 10. 기댓값(Expectation)

기댓값(Expectation)기댓값(Expectation)이란?기댓값은 확률 변수의 평균적인 값을 나타내는 개념으로, 확률 분포의 중심을 보여줍니다. 이는 확률론과 통계학에서 매우 중요한 개념으로, 데이터나 확률 변수의 일반적인 경향을 파악하는 데 유용합니다.기댓값의 정의이산 확률 변수의 기댓값: 확률 변수가 이산적일 때는 가능한 값들에 확률을 곱한 값들의 합으로 기댓값을 계산합니다.여기서 x_i는 확률 변수 X가 가질 수 있는 값, P(x_i)는 해당 값이 나타날 확률입니다. 연속 확률 변수의 기댓값: 확률 변수가 연속적일 때는 확률 밀도 함수(pdf)를 사용하여 기댓값을 구합니다.여기서 f(x)는 확률 밀도 함수입니다.기댓값의 성질선형성: 기댓값은 선형 연산에 대해 다음과 같은 성질을 가집니다. 이는..

[파이썬을 활용한 통계 개념 기초] 09. 음이항 분포(Negative binomial distribution)
통계/파이썬을 이용한 통계 기초2024. 10. 17. 08:30[파이썬을 활용한 통계 개념 기초] 09. 음이항 분포(Negative binomial distribution)

음이항 분포(Negative binomial distribution) 음이항 분포(Negative Binomial Distribution)의 개념음이항 분포는 이항 분포의 확장된 개념으로, 특정한 사건(성공)이 r번 일어날 때까지 실패가 몇 번 일어나는지에 대한 확률 분포입니다. 이 분포는 베르누이 시행의 반복으로 이루어집니다. 주요 개념이항 분포(Binomial Distribution): 성공/실패 두 가지 결과만 있는 베르누이 시행을 n번 반복했을 때, r번 성공할 확률을 나타냅니다. 시행 횟수 n은 고정되어 있습니다.음이항 분포: r번 성공할 때까지 시행되는 베르누이 시행의 실패 횟수에 대한 분포를 나타냅니다. 이때, 성공 횟수 r은 고정되어 있지만, 시행 횟수 n은 고정되지 않습니다.수식음이항 분..

통계/파이썬을 이용한 통계 기초2024. 10. 10. 08:30[파이썬을 활용한 통계 개념 기초] 08. 근사(Approximation)

근사(Approximation)근사(Approximation)의 정의근사는 복잡하거나 정확한 계산이 어려운 문제를 간단한 방법으로 대체하여 해결하는 방법입니다. 통계에서 주로 정규분포 근사가 많이 사용되며, 복잡한 분포를 더 계산이 쉬운 정규분포로 대체하여 계산하는 경우가 많습니다.근사의 필요성복잡한 계산 단순화: 많은 실제 문제에서는 표본 크기가 크거나 계산이 복잡하여 정확한 확률 분포를 계산하는 것이 어렵습니다. 이때 근사를 통해 대략적인 결과를 얻는 것이 실질적으로 유용할 수 있습니다.실용성: 통계에서는 분석 속도와 실용성을 높이기 위해 자주 근사 방법을 사용합니다. 예를 들어, 큰 표본에서 이항분포나 포아송 분포 등을 정규분포로 근사하여 처리할 수 있습니다.정규분포 근사 (Normal Approx..

[파이썬을 활용한 통계 개념 기초] 07. 표준화와 정규화(Standardization and Normalization)
통계/파이썬을 이용한 통계 기초2024. 10. 5. 09:30[파이썬을 활용한 통계 개념 기초] 07. 표준화와 정규화(Standardization and Normalization)

표준화와 정규화는 스케일링 (Scaling) 기법으로, 데이터의 스케일을 조정하여 모델이 특정 변수에 의존하거나 왜곡된 결과를 내는 것을 방지하고, 더 정확한 예측과 분석을 할 수 있게 돕습니다. 특히 머신러닝과 딥러닝에서 자주 사용됩니다.표준화와 정규화표준화 (Standardization)정의 : 데이터의 평균을 0, 표준편차를 1로 변환하는 기법.목적 : 다양한 변수의 분포와 단위가 다를 때, 동일한 기준으로 변환하여 상대적 비교를 용이하게 합니다.수식 :특징 :평균이 0, 표준편차가 1로 맞춰짐.데이터 분포의 모양은 유지하되, 중심을 0으로 맞추고 스케일을 조정하여, 모든 변수들이 동일한 표준편차를 갖게 함.이상치(Outliers)가 있는 데이터에도 강한 내성을 가질 수 있습니다. (평균 중심의 변..

300x250
image