기댓값(Expectation)기댓값(Expectation)이란?기댓값은 확률 변수의 평균적인 값을 나타내는 개념으로, 확률 분포의 중심을 보여줍니다. 이는 확률론과 통계학에서 매우 중요한 개념으로, 데이터나 확률 변수의 일반적인 경향을 파악하는 데 유용합니다.기댓값의 정의이산 확률 변수의 기댓값: 확률 변수가 이산적일 때는 가능한 값들에 확률을 곱한 값들의 합으로 기댓값을 계산합니다.여기서 x_i는 확률 변수 X가 가질 수 있는 값, P(x_i)는 해당 값이 나타날 확률입니다. 연속 확률 변수의 기댓값: 확률 변수가 연속적일 때는 확률 밀도 함수(pdf)를 사용하여 기댓값을 구합니다.여기서 f(x)는 확률 밀도 함수입니다.기댓값의 성질선형성: 기댓값은 선형 연산에 대해 다음과 같은 성질을 가집니다. 이는..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)A/B 테스트의 개요데이터 기반 의사결정의 중요성성공하는 서비스들은 대부분 직감이 아닌 데이터를 기반으로 의사결정을 내립니다.데이터 기반 의사결정을 하는 이유첫 번째 이유는 리스크를 줄일 수 있기 때문입니다. 직관에 의존한 의사결정은 실패할 확률이 높으며, 경쟁이 치열한 오늘날의 환경에서는 실패 시 도태되기 쉽습니다. 데이터를 기반으로 의사결정을 하면 사용자의 반응을 실험을 통해 빠르게 확인하고, 출시 이후 발생할 수 있는 실패의 리스크를 줄일 수 있습니다.두 번째 이유는 성공과 실패의 원인을 명확히 파악할 수 있기 때문입니다. 데이터를 기반으로 하지 않으면 성공이나 실패의..
데이터 프레임은 R에서 가장 많이 사용되는 데이터 구조 중 하나로, 행과 열로 구성된 2차원 데이터 구조입니다.각각의 열은 벡터로 구성되며, 서로 다른 데이터 유형을 가질 수 있습니다.데이터 프레임은 주로 통계 분석이나 데이터 과학 작업에서 사용됩니다.데이터 프레임 생성 (data.frame() 함수 사용)data.frame() 함수는 R에서 데이터 프레임을 생성할 때 사용되는 가장 기본적인 함수입니다.여러 벡터를 모아 데이터 프레임으로 변환할 수 있습니다.기본적인 데이터 프레임 생성# 벡터로 데이터 프레임 생성name 위의 코드에서 name, age, gender라는 세 개의 벡터를 결합하여 데이터 프레임을 생성했습니다.각 벡터는 데이터 프레임의 열이 되며, 행은 벡터의 요소에 해당합니다. 위에서 생성..