통계/파이썬을 이용한 통계 기초2024. 10. 10. 08:30[파이썬을 활용한 통계 개념 기초] 08. 근사(Approximation)

근사(Approximation)근사(Approximation)의 정의근사는 복잡하거나 정확한 계산이 어려운 문제를 간단한 방법으로 대체하여 해결하는 방법입니다. 통계에서 주로 정규분포 근사가 많이 사용되며, 복잡한 분포를 더 계산이 쉬운 정규분포로 대체하여 계산하는 경우가 많습니다.근사의 필요성복잡한 계산 단순화: 많은 실제 문제에서는 표본 크기가 크거나 계산이 복잡하여 정확한 확률 분포를 계산하는 것이 어렵습니다. 이때 근사를 통해 대략적인 결과를 얻는 것이 실질적으로 유용할 수 있습니다.실용성: 통계에서는 분석 속도와 실용성을 높이기 위해 자주 근사 방법을 사용합니다. 예를 들어, 큰 표본에서 이항분포나 포아송 분포 등을 정규분포로 근사하여 처리할 수 있습니다.정규분포 근사 (Normal Approx..

[파이썬을 활용한 통계 개념 기초] 07. 표준화와 정규화(Standardization and Normalization)
통계/파이썬을 이용한 통계 기초2024. 10. 5. 09:30[파이썬을 활용한 통계 개념 기초] 07. 표준화와 정규화(Standardization and Normalization)

표준화와 정규화는 스케일링 (Scaling) 기법으로, 데이터의 스케일을 조정하여 모델이 특정 변수에 의존하거나 왜곡된 결과를 내는 것을 방지하고, 더 정확한 예측과 분석을 할 수 있게 돕습니다. 특히 머신러닝과 딥러닝에서 자주 사용됩니다.표준화와 정규화표준화 (Standardization)정의 : 데이터의 평균을 0, 표준편차를 1로 변환하는 기법.목적 : 다양한 변수의 분포와 단위가 다를 때, 동일한 기준으로 변환하여 상대적 비교를 용이하게 합니다.수식 :특징 :평균이 0, 표준편차가 1로 맞춰짐.데이터 분포의 모양은 유지하되, 중심을 0으로 맞추고 스케일을 조정하여, 모든 변수들이 동일한 표준편차를 갖게 함.이상치(Outliers)가 있는 데이터에도 강한 내성을 가질 수 있습니다. (평균 중심의 변..

프로그래밍 언어/R2024. 9. 13. 08:0017. R을 활용한 기본 통계 1️⃣ (기초 통계 분석 및 확률 분포)

기초 통계 분석은 데이터를 이해하고 설명하기 위한 첫 번째 단계로, 데이터의 주요 특성을 요약하고 시각화하는 데 중점을 둡니다.R 프로그래밍에서는 다양한 기본 함수를 사용해 이러한 분석을 쉽게 수행할 수 있습니다.기초 통계 분석기본 통계량 계산평균(mean): 데이터의 중심 위치를 나타내며, R에서는 mean() 함수를 사용해 계산합니다.mean_value 중앙값(median): 데이터를 크기 순으로 정렬했을 때 중앙에 위치한 값으로, 이상치에 영향을 덜 받습니다. R에서는 median() 함수로 계산합니다.median_value 분산(var) 및 표준편차(sd): 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 나타냅니다. 분산은 var(), 표준편차는 sd() 함수로 계산합니다.variance 범위(r..

[파이썬을 활용한 통계 개념 기초] 04. 정규 분포(Normal distribution)
통계/파이썬을 이용한 통계 기초2024. 9. 7. 13:15[파이썬을 활용한 통계 개념 기초] 04. 정규 분포(Normal distribution)

정규 분포(Normal Distribution)정의: 정규분포는 연속 확률 분포 중에 가장 일반적으로 많이 사용되는 분포입니다. 중심극한정리(CLT;Central limit theorem)에 의해 표본 평균의 분포가 정규분포를 따르게 되는 현상이 있어 통계학에서 매우 중요한 분포라고 할 수 있습니다.주요 특징:정규 분포는 평균과 분산이라는 두개의 모수(모집단의 특성)를 가지고 있습니다.평균 (μ, 평균): 분포의 중심을 나타냅니다. 평균이 클수록 정규 분포의 중심이 오른쪽으로 이동하며, 작을수록 왼쪽으로 이동합니다.분산 (σ², 분산): 데이터가 얼마나 퍼져 있는지를 나타냅니다.(분산은 편차의 제곱 합으로 단위가 평균과 다르다.)표준편차(σ, 표준편차) : 분산의 제곱근으로, 데이터가 평균으로부터 얼마나..

[파이썬을 활용한 통계 개념 기초] 02. 확률 분포(Probability distribution)
통계/파이썬을 이용한 통계 기초2024. 8. 25. 15:31[파이썬을 활용한 통계 개념 기초] 02. 확률 분포(Probability distribution)

지난번 01. 확률(Probability) 글에서 설명한 확률 분포는 균일 분포(Uniform distribution)라고 말할 수 있습니다.지난번에 설명한 균일 분포 (Uniform Distribution)를 다시 설명하면 균일 분포란 사건의 모든 가능한 결과가 동일한 확률을 가지는 분포입니다.(사건이 무엇인지와 무관하게 확률이 동일한 분포)균일 분포는 결과 간의 확률이 무차별적이며, 특정한 값이 나타날 가능성이 다른 값들과 동일합니다. 일반적으로 확률 분포의 값은 사건과 모수(parameter)에 따라 달라지며, 그 사이의 관계를 수식을 통해 정의할 수 있습니다.베르누이 분포 (Bernoulli Distribution)정의: 결과가 두 가지(예: 성공/실패)로 나뉘는 이산 확률 분포(결과 값이 둘 중..

300x250
image