이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)이번 글에서는 엑셀에서의 데이터 전처리에 이어 데이터 분석에 대한 내용 정리를 하려고 합니다.이번 글에서는 엑셀에서 하는 기술 통계, t-test, 분산 분석과 회귀 분석에 대한 내용을 다룰 예정입니다.엑셀에서의 데이터 분석엑셀에서의 데이터 분석에 대해 기술 통계 분석 / t검정 / 분산 분석(AVONA) / 회귀 분석(regression anlaysis) 4가지 방법을 소개하겠습니다.엑셀에서는 위 4가지 분석을 포함한 다양한 데이터 분석 툴을 Analaysis Toolpak 이라는 이름으로 자체적으로 제공하고 있습니다.엑셀에서의 데이터 분석은 데이터 전처리가 먼저 선행된 ..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)이번 글에서는 엑셀의 기초에 이어 엑셀에서의 데이터 전처리에 대한 내용 정리를 하려고 합니다.이번 글에서는 범주형 변수 처리, 결측값 처리, 이상치 처리에 대한 내용을 다룰 예정입니다.엑셀에서의 데이터 전처리데이터 전처리(pre-processing)데이터 전처리는 데이터를 통계적으로 분석하거나, 머신러닝을 통해 예측 모델을 만들 수 있도록 완벽한 상태로 가다듬는 과정을 말합니다.데이터 전처리는 데이터 분석 과정의 최소 50%이상을 차지합니다.데이터 전처리 단계에서 요구되는 과정은 범주형 변수 처리 / 결측치 처리 / 이상치 처리/ 데이터 병합(엑셀에서 이 과정은 까다롭다.)..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)이번 글에서는 저번 엑셀 개념 정리 글에서 못다한 엑셀 기초에 대한 내용 정리를 이어서 하려고 합니다.저번 글에서는 엑셀에서 기본적이고 자주 사용하는 함수들에 대한 내용을 설명하던 중간에 마무리하게 되었으며, 엑셀에서 기본적이고 자주 사용되는 함수들인 MAX, MIN, SUM, AVERAGE, RANK.EQ, COUNT, COUNTA, IF, IFERROR, COUNTIF, COUNTIFS, SUMIF, SUMIFS 에 대해 설명했었습니다.이번 글에서는 엑셀의 함수들을 마저 설명한 뒤에 이어 차트, 조건부서식, 피벗테이블을 설명하고 엑셀의 기초를 마무리하려고 합니다.엑셀에서..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)엑셀 (Excel)엑셀은 모든 데이터 파일의 통일된 형식을 제공하고, 데이터의 내용이 담겨있는 방식을 보여주는 프로그램입니다.또한 그 내용을 통해 데이터를 이용하고 분석에 대한 상상을 가능하게 한다는 장점을 가지고 있습니다.엑셀의 특성실제로 대부분의 국내외 연구자, 혹은 데이터 분석자들은 xlsx(엑셀 파일의 확장자)나 csv(comma separated values, 쉼표로 구분된 텍스트)의 형태로 정의된 파일을 활용하여 데이터 분석을 진행합니다. 엑셀은 이러한 데이터들을 손 쉽게 열어볼 수 있는 프로그램입니다.분석에 활용되는 모든 데이터의 내용이 엑셀의 구조와 똑같은 모..