[파이썬을 활용한 통계 개념 기초] 03. 확률 질량 함수와 확률 밀도 함수 (pmf & pdf)
통계/파이썬을 이용한 통계 기초2024. 9. 3. 12:30[파이썬을 활용한 통계 개념 기초] 03. 확률 질량 함수와 확률 밀도 함수 (pmf & pdf)

확률 질량 함수와 확률 밀도 함수확률 질량 함수 (pmf) 정의:확률 질량 함수는 X의 값이 이산적(Discrete)일 때 사용됩니다. 이는 X가 0이나 1, 2와 같이 특정한 값을 가질 때 해당 값에 대한 확률을 정의하는 함수입니다.X가 취할 수 있는 값들이 유한하거나 셀 수 있을 때, 각각의 값에 확률을 할당합니다.확률 질량 함수의 예 :성별, 학년, 인원 수특징:확률 질량 함수의 출력은 특정 값에 대한 확률입니다. 예를 들어, 주사위를 굴렸을 때 특정 눈금이 나올 확률은 확률 질량 함수로 표현할 수 있습니다.이산형 확률 분포에서는 각 X 값에 대해 개별적인 확률을 구하고, 이 값들을 모두 더하면 전체 확률이 1이 됩니다.예를 들어, 공정한 6면체 주사위를 굴리는 경우, 주사위 눈금 1이 나올 확률은..

[파이썬을 활용한 통계 개념 기초] 02. 확률 분포(Probability distribution)
통계/파이썬을 이용한 통계 기초2024. 8. 25. 15:31[파이썬을 활용한 통계 개념 기초] 02. 확률 분포(Probability distribution)

지난번 01. 확률(Probability) 글에서 설명한 확률 분포는 균일 분포(Uniform distribution)라고 말할 수 있습니다.지난번에 설명한 균일 분포 (Uniform Distribution)를 다시 설명하면 균일 분포란 사건의 모든 가능한 결과가 동일한 확률을 가지는 분포입니다.(사건이 무엇인지와 무관하게 확률이 동일한 분포)균일 분포는 결과 간의 확률이 무차별적이며, 특정한 값이 나타날 가능성이 다른 값들과 동일합니다. 일반적으로 확률 분포의 값은 사건과 모수(parameter)에 따라 달라지며, 그 사이의 관계를 수식을 통해 정의할 수 있습니다.베르누이 분포 (Bernoulli Distribution)정의: 결과가 두 가지(예: 성공/실패)로 나뉘는 이산 확률 분포(결과 값이 둘 중..

[파이썬을 활용한 통계 개념 기초] 01. 확률(Probability)
통계/파이썬을 이용한 통계 기초2024. 8. 18. 16:15[파이썬을 활용한 통계 개념 기초] 01. 확률(Probability)

확률 분포를 왜 알아야 하는가?확률 분포는 데이터 분석, 통계, 그리고 머신러닝에서 매우 중요한 역할을 합니다. 우리가 사용하는 다양한 통계 모델과 머신러닝 모델들은 대부분 확률 분포에 기반을 두고 있습니다. 이를 이해함으로써 우리는 이러한 모델들이 어떻게 작동하는지, 그 유용성과 한계를 이해할 수 있게 됩니다. 적절한 상황에서 적절한 모델을 선택하고 사용할 수 있는 능력도 키울 수 있습니다. 확률의 정의확률이란 어떤 사건이 발생할 가능성을 수치로 표현한 것입니다. 주사위를 던질 때 특정 숫자가 나올 확률처럼, 어떤 사건이 얼마나 자주 발생할지를 예측하는데 사용됩니다. 확률은 일반적으로 0에서 1 사이의 값으로 표현됩니다. 0은 사건이 절대 일어나지 않음을, 1은 사건이 반드시 일어남을 의미합니다.확률의..

[파이썬 개념 정리 7]통계의 기본과 파이썬을 이용한 데이터 시각화 개념
프로그래밍 언어/Python2024. 7. 5. 09:51[파이썬 개념 정리 7]통계의 기본과 파이썬을 이용한 데이터 시각화 개념

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)상자그림 (Box Plot) 상자 그림에서 박스 중간에 있는 선을 50% 지점인 중간값(Median)이라고 합니다.상자의 아래 부분은 25% 지점으로 제 1 사분위수(Q1)이라고 합니다.상자의 아래 부분은 75% 지점으로 제 3 사분위수(Q3)이라고 합니다.박스 밖에 동떨어져 존재하는 값들을 이상치(Outlier)라고 합니다.제 3사분위수(Q3)에서 제 1사분위수(Q1)를 뺀 범위를 사분위수 범위(IQR ; Interquartile range)라고 하며, 그리고 1, 3 사분위수에서 1.5*IQR만큼 떨어진 값들까지 정상 범주라고 생각하면 됩니다. 상자 그림을 통해 이상치의..

통계2024. 7. 5. 09:16[통계 개념 정리 1]기초 통계 개념 정리

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)기술통계와 추론통계통계통계란 어떤 상황을 쉽게 이해할 수 있도록 숫자로 정리하는 것이다.통계는 기술통계와 추론통계로 나뉜다.기술통계(Descriptive Statistics)데이터를 요약하고 핵심적인 특징을 파악하는 통계기술통계량 : 평균 / 중간값 / 이상점추론통계(Inferential statistics)표본을 바탕으로 모집단을 추론하는 통계 (모집단의 사이즈가 너무 커서 표본을 추출하여 모집단을 추론한다.)모집단(Population) : 관심 대상의 전체집합표본(sample) : 모집단에서 뽑아낸 일부 대표값과 산포도기술통계의 대표값평균 (mean) : 데이터 합계 /..

300x250
image