이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)Pandas의 Dataframepandas를 사용하면 표 형태의 데이터인 데이터프레임을 불러와서 자유롭게 분석하고 가공할 수 있습니다.평소 주로 사용하는 데이터는 표 형태로, pandas를 사용하는 법을 알고 있다면, 업무나 일상에서 사용하는 다양한 데이터를 원하는 대로 분석할 수 있습니다.pandas의 장점이자 단점은 기능이 많다는 점입니다.(다양한 문법을 가짐)그래서 이번 정리에서는 pandas를 다루며 핵심적으로 필요한 문법만 정리할 예정으로, 이를 숙지한다면, 데이터를 능숙하게 다룰 수 있습니다.Pandas에서는 dataframe을 능숙하게 다루는 것이 중요합니다.D..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)Pandas표 형태의 데이터를 간편하게 다루고 분석하기 위한 라이브러리 (numpy는 pandas에 비해 가독성이 떨어지고, 정보에 대한 레이블 삽입 불가, 한가지 데이터 타입만 사용 가능하다)numpy를 기반으로 만들어진 대표적인 라이브러리데이터 분석에서 50% 이상 사용하는 라이브러리과정데이터 불러오기데이터 전처리(가공)데이터 분석데이터 시각화pandas 호출import pandas as pd # pandas 호출데이터프레임데이터 프레임은 여러 개의 시리즈로 구성되어 있다.가로 줄 - 행 (row) / 세로줄 - 열 (column)import pandas as pdimp..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)라이브러리데이터 분석 실무에서 많이 활용하는 Toolkit으로, 파이썬에서 필수적인 요소이다.대표적인 라이브러리numpy : 수치적인 연산을 할때 많이 활용함pandas : 데이터를 표 형식으로 정리하고 분석함matplotlib : 데이터의 효과적인 전달을 위해 데이터를 시각화할 때 사용함Numpy(Numerical Python)수치적인 연산에 최적화된 라이브러리이다.(파이썬 도구)수학 연산과 통계 연산이 내장되어 있다.장점 1) 메모리 최적화 2) 연산 최적화numpy이 없이 사용했을 때 상대적으로 복잡한 구현을 numpy로 간단하게 쓸 수 있다.넘파이의 근본이 되는 자료..