[파이썬을 활용한 통계 개념 기초] 02. 확률 분포(Probability distribution)
통계/파이썬을 이용한 통계 기초2024. 8. 25. 15:31[파이썬을 활용한 통계 개념 기초] 02. 확률 분포(Probability distribution)

지난번 01. 확률(Probability) 글에서 설명한 확률 분포는 균일 분포(Uniform distribution)라고 말할 수 있습니다.지난번에 설명한 균일 분포 (Uniform Distribution)를 다시 설명하면 균일 분포란 사건의 모든 가능한 결과가 동일한 확률을 가지는 분포입니다.(사건이 무엇인지와 무관하게 확률이 동일한 분포)균일 분포는 결과 간의 확률이 무차별적이며, 특정한 값이 나타날 가능성이 다른 값들과 동일합니다. 일반적으로 확률 분포의 값은 사건과 모수(parameter)에 따라 달라지며, 그 사이의 관계를 수식을 통해 정의할 수 있습니다.베르누이 분포 (Bernoulli Distribution)정의: 결과가 두 가지(예: 성공/실패)로 나뉘는 이산 확률 분포(결과 값이 둘 중..

프로그래밍 언어/R2024. 8. 25. 00:0609. R에서 사용하는 기본 함수 이해 - 사용자 정의 함수 생성

R에서 사용자 정의 함수를 작성하는 것은 반복적인 작업을 자동화하고, 코드를 보다 효율적이고 재사용 가능하게 만드는 데 중요한 역할을 합니다. 사용자 정의 함수는 기본적인 연산을 수행하는 간단한 함수부터 복잡한 분석 작업을 수행하는 함수까지 다양하게 활용될 수 있습니다. 이번 글에서는 R에서 사용자 정의 함수를 작성하고 사용하는 방법에 대해 자세히 알아보고, 실용적인 예시들을 통해 이를 이해하는 데 도움을 드리고자 합니다.사용자 정의 함수 생성R에서 사용자 정의 함수는 코드의 재사용성을 높이고, 특정 작업을 반복적으로 수행할 때 매우 유용합니다.기본 사용자 정의 함수 생성함수 생성 구문 R에서 함수를 정의하는 기본 구문은 밑과 같습니다.function_name unction_name: 함수를 호출할 때 ..

프로그래밍 언어/R2024. 8. 24. 23:0008. R에서 사용하는 기본 함수 이해

R은 강력한 데이터 분석 및 시각화 도구로서, 다양한 함수들을 통해 데이터를 효율적으로 처리하고 분석할 수 있습니다. 특히, R에서 제공하는 기본 함수들은 데이터 조작, 탐색, 통계 계산, 시각화 등 여러 작업을 손쉽게 수행할 수 있도록 도와줍니다. 이 글에서는 R에서 자주 사용되는 기본 함수들을 정리하여 소개하고자 합니다. R을 처음 접하신 분들이나, 기본기를 다시 점검하고 싶은 분들에게 유용한 참고자료가 되기를 바랍니다.R에서 자주 사용하는 기본 함수기본 연산 및 통계 함수sum(x):벡터 x의 모든 요소를 더한 값을 반환합니다.예: sum(c(1, 2, 3, 4))은 10을 반환합니다.mean(x):벡터 x의 평균을 계산합니다. 이는 모든 요소의 합을 요소의 개수로 나눈 값입니다.예: mean(c(..

프로그래밍/데이터 분석2024. 8. 23. 18:55[데이터 분석 심화 개념] 웹 자동화 개념 정리 4️⃣ (Beautifulsoup)

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)웹에서 데이터 얻기(Beautifulsoup)  크롬 개발자 도구크롬 개발자 도구(Chrome Developer Tools)는 웹 개발자들이 웹 페이지를 분석하고 디버깅하는 데 사용하는 도구입니다.이 도구는 웹 페이지의 구조, 스타일, 네트워크 요청 등을 실시간으로 확인하고 수정할 수 있도록 도와줍니다.개발자 도구를 사용하면 웹 페이지가 어떻게 구성되어 있는지, 그리고 각 요소가 어떻게 스타일링되고 동작하는지 이해할 수 있습니다. 개발자 도구 사용법Windows : 웹 페이지에서 마우스 오른쪽 버튼을 클릭한 후 "검사"를 선택하거나, 키보드에서 F12 키를 눌러 개발자 도구..

프로그래밍 언어/R2024. 8. 22. 18:5507. R에서의 기본 연산자 이해 (산술, 비교, 논리, 결측값 처리 연산자)

R 프로그래밍 언어는 데이터 분석과 통계 작업에 강력한 도구입니다. 특히, 다양한 연산자를 활용하여 데이터를 효과적으로 처리하고 분석할 수 있습니다. 이번 포스팅에서는 R에서 자주 사용되는 산술 연산자, 비교 연산자, 논리 연산자, 그리고 결측값 처리 방법에 대해 간단히 알아보겠습니다.산술 연산자산술 연산자는 수치 데이터와 관련된 연산을 수행할 때 사용됩니다.덧셈 (+): 두 숫자를 더합니다.뺄셈 (): 두 숫자 사이의 차이를 계산합니다.곱셈 (): 두 숫자를 곱합니다.나눗셈 (/): 두 숫자를 나눕니다.거듭제곱 (^): 첫 번째 숫자를 두 번째 숫자만큼 거듭제곱합니다.나머지 (%%): 두 숫자를 나눈 나머지를 반환합니다.몫 (%/%): 두 숫자를 나눈 후, 나머지를 버리고 몫만 반환합니다.# 덧셈 연산..

프로그래밍/데이터 분석2024. 8. 21. 18:55[데이터 분석 심화 개념] 웹 자동화 개념 정리 3️⃣ (웹 스타일링)

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)웹 스타일링웹페이지 살펴보기웹 페이지를 이해하고 살펴보는 것은 웹 개발이나 웹 스크래핑을 할 때 매우 중요한 과정입니다. 웹 페이지는 HTML(HyperText Markup Language)이라는 언어로 작성되며, 이 HTML은 다양한 태그(Tags)들로 구성됩니다. 각 태그는 웹 페이지의 특정 요소를 정의하고 구조화합니다. HTML(HyperText Markup Language)은 웹 페이지의 기본 구조를 정의하는 언어입니다. HTML은 텍스트 콘텐츠, 이미지, 링크, 폼 등 다양한 웹 요소를 표시하기 위해 사용됩니다. 웹 브라우저는 HTML 파일을 읽어들여, 그 내용을 ..

스프린트/위클리페이퍼2024. 8. 21. 12:40[#8] 스프린트 DA 트랙 10주차 위클리 페이퍼(AARRR 프레임워크, Funnel 분석, 코호트, 세그먼트, RFM 분석)

위클리 페이퍼는 현재 훈련받고 있는 코드잇 스프린트 데이터 애널리스트 트랙에서 매주마다 훈련생 스스로 프로그래밍 언어, 데이터분석, 통계, 머신러닝 등 특정 주제에 대하여 심화 학습을 할 수 있도록 제출하는 과제입니다.(매주 2~3가지 주제를 스스로 알아보고 학습하여 관련된 내용을 정리하여 후에 취업 활동 간에 경험할 수 있는 기술 면접을 대비함)9주차에 이어 이번 10주차 위클리 페이퍼의 내용을 소개하겠습니다. 이번 8번째 위클리 페이퍼 주제는1. AARRR 프레임워크(취득, 활성화, 유지, 수익 창출, 추천)와 리텐션 개념을 설명해 주세요. Funnel 분석과의 연관성을 설명해 주세요.2. 코호트와 세그먼트의 차이점은 무엇인가요?3. RFM 분석(Recency, Frequency, Monetary v..

프로그래밍 언어/R2024. 8. 20. 18:5506. R 프로그램에서 파일 읽기 및 쓰기

R 프로그램에서 파일 읽기 및 쓰기는 데이터 분석과 시각화를 위해 중요한 작업입니다.다양한 파일 형식에 따라 R에서 파일을 읽고 쓸 수 있는 함수들이 다르며, 각기 다른 데이터 구조를 다룰 수 있습니다.이번 글에서는 데이터를 다룰 수 있도록 파일 형식에 따라 읽고 쓰는 방법에 대해 설명하겠습니다.RData 및 RDS 파일RData 및 RDS 파일 형식은 R 객체를 저장하거나 불러올 때 유용합니다.RData 파일 읽기 및 쓰기RData는 load()와 save() 함수를 사용하여 R 환경 내의 여러 객체를 한 번에 저장하고 불러올 수 있습니다.save(data, file = "파일경로/파일이름.RData")load("파일경로/파일이름.RData")RDS 파일 읽기 및 쓰기readRDS()와 saveRDS(..

300x250
image