정규 분포(Normal Distribution)정의: 정규분포는 연속 확률 분포 중에 가장 일반적으로 많이 사용되는 분포입니다. 중심극한정리(CLT;Central limit theorem)에 의해 표본 평균의 분포가 정규분포를 따르게 되는 현상이 있어 통계학에서 매우 중요한 분포라고 할 수 있습니다.주요 특징:정규 분포는 평균과 분산이라는 두개의 모수(모집단의 특성)를 가지고 있습니다.평균 (μ, 평균): 분포의 중심을 나타냅니다. 평균이 클수록 정규 분포의 중심이 오른쪽으로 이동하며, 작을수록 왼쪽으로 이동합니다.분산 (σ², 분산): 데이터가 얼마나 퍼져 있는지를 나타냅니다.(분산은 편차의 제곱 합으로 단위가 평균과 다르다.)표준편차(σ, 표준편차) : 분산의 제곱근으로, 데이터가 평균으로부터 얼마나..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)기술통계와 추론통계통계통계란 어떤 상황을 쉽게 이해할 수 있도록 숫자로 정리하는 것이다.통계는 기술통계와 추론통계로 나뉜다.기술통계(Descriptive Statistics)데이터를 요약하고 핵심적인 특징을 파악하는 통계기술통계량 : 평균 / 중간값 / 이상점추론통계(Inferential statistics)표본을 바탕으로 모집단을 추론하는 통계 (모집단의 사이즈가 너무 커서 표본을 추출하여 모집단을 추론한다.)모집단(Population) : 관심 대상의 전체집합표본(sample) : 모집단에서 뽑아낸 일부 대표값과 산포도기술통계의 대표값평균 (mean) : 데이터 합계 /..