프로그래밍 언어/Python2024. 7. 28. 21:54[파이썬 개념 정리 11] Pandas의 DataFrame 마스터하기 1️⃣ (DataFrame의 기본)

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)Pandas의 Dataframepandas를 사용하면 표 형태의 데이터인 데이터프레임을 불러와서 자유롭게 분석하고 가공할 수 있습니다.평소 주로 사용하는 데이터는 표 형태로, pandas를 사용하는 법을 알고 있다면, 업무나 일상에서 사용하는 다양한 데이터를 원하는 대로 분석할 수 있습니다.pandas의 장점이자 단점은 기능이 많다는 점입니다.(다양한 문법을 가짐)그래서 이번 정리에서는 pandas를 다루며 핵심적으로 필요한 문법만 정리할 예정으로, 이를 숙지한다면, 데이터를 능숙하게 다룰 수 있습니다.Pandas에서는 dataframe을 능숙하게 다루는 것이 중요합니다.D..

프로그래밍 언어/Python2024. 7. 18. 22:07[파이썬 개념 정리 10] 객체와 클래스 개념 정리

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)객체(Object)일반적으로 말하는 객체 : 컴퓨터,사람, 자동차처럼 우리가 주변에서 떠올릴 수 있는 모든 것프로그래밍에서의 객체 : 데이터와 그 데이터를 활용한 함수들을 묶어서 저장해 놓을 수 있는 것들파이썬에서 사용하는 수많은 기능들은 객체로 만들어져 있습니다. 새로운 기능을 만들때도 객체를 활용해야 합니다.데이터 사이언스, 웹 개발, 업무 자동화 등 분야에 상관없이 초급자에서 벗어나 사용하는 코드를 모두 이해하고 본인만의 새로운 기능을 만들어내면서 자유자재로 프로그래밍하기 위해서는 객체가 어떻게 작동하는지 이해해야 합니다.데이터 → 속성함수가 작동하는 것 → 행동객체와..

프로그래밍 언어/Python2024. 7. 15. 23:28[파이썬 개념 정리 9] 맥 운영체제에서 파이썬 환경 구축 내용 정리

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)파이썬 환경환경 : 우리에게 직접적 혹은 간접적으로 영향을 주는 자연적 조건이나 사회적 상황 예) 날씨, 경제적 여유, 문화개발 환경 : 프로그래밍 코드를 작성하거나 실행할 때 영향을 주는 여러가지 요소 예) 운영체제, 텍스트 에디터나 IDE, 특정 언어 버전, (프레임워크, 라이브러리, 패키지) + 버전, 컴퓨터 사양목차파이썬과 파이썬 패키지 작동 원리파이썬과 파이썬 패키지가 실행에 미치는 영향파이썬 환경을 만들고, 관리하고, 공유하는 방법파이썬 환경의 개요개발 환경이란 운영 체제, 텍스트 에디터나 IDE, 특정 언어 버전, 라이브러리와 패키지 버전, 컴퓨터 사양 등을 말..

[파이썬 개념 정리 8]Seaborn 라이브러리를 이용한 시각화 개념
프로그래밍 언어/Python2024. 7. 5. 11:31[파이썬 개념 정리 8]Seaborn 라이브러리를 이용한 시각화 개념

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)Seaborn 라이브러리Seaborn 라이브러리는 통계 정보 시각화 라이브러리로 간결한 코드로 그래프 생성하는 기능을 제공합니다.Matplotlib보다 근사한 그래프를 쉽게 그릴 수 있는 라이브러리Matplotlib과 Seaborn의 차이Seaborn : 간편하게 근사한 그래프 생성Matplotlib : 원하는대로 커스텀하게 그래프 생성# seaborn 라이브러리로 그래프를 그리기 전에 필요한 라이브러리 호출import seaborn as snsimport pandas as pdimport matplotlib.pyplot as plt바 그래프 (bar) # 검은색 막대기를 ..

[파이썬 개념 정리 7]통계의 기본과 파이썬을 이용한 데이터 시각화 개념
프로그래밍 언어/Python2024. 7. 5. 09:51[파이썬 개념 정리 7]통계의 기본과 파이썬을 이용한 데이터 시각화 개념

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)상자그림 (Box Plot) 상자 그림에서 박스 중간에 있는 선을 50% 지점인 중간값(Median)이라고 합니다.상자의 아래 부분은 25% 지점으로 제 1 사분위수(Q1)이라고 합니다.상자의 아래 부분은 75% 지점으로 제 3 사분위수(Q3)이라고 합니다.박스 밖에 동떨어져 존재하는 값들을 이상치(Outlier)라고 합니다.제 3사분위수(Q3)에서 제 1사분위수(Q1)를 뺀 범위를 사분위수 범위(IQR ; Interquartile range)라고 하며, 그리고 1, 3 사분위수에서 1.5*IQR만큼 떨어진 값들까지 정상 범주라고 생각하면 됩니다. 상자 그림을 통해 이상치의..

프로그래밍 언어/Python2024. 6. 29. 16:13[파이썬 개념 정리 6]Pandas 라이브러리 개념 정리

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)Pandas표 형태의 데이터를 간편하게 다루고 분석하기 위한 라이브러리 (numpy는 pandas에 비해 가독성이 떨어지고, 정보에 대한 레이블 삽입 불가, 한가지 데이터 타입만 사용 가능하다)numpy를 기반으로 만들어진 대표적인 라이브러리데이터 분석에서 50% 이상 사용하는 라이브러리과정데이터 불러오기데이터 전처리(가공)데이터 분석데이터 시각화pandas 호출import pandas as pd # pandas 호출데이터프레임데이터 프레임은 여러 개의 시리즈로 구성되어 있다.가로 줄 - 행 (row) / 세로줄 - 열 (column)import pandas as pdimp..

프로그래밍 언어/Python2024. 6. 29. 00:44[파이썬 개념 정리 6]Matplotlib 라이브러리 개념 정리

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)Matplotlib파이썬과 넘파이를 기반으로 만들어진 데이터 시각화 라이브러리시각적으로 표현해서 데이터를 요약해서 볼 수 있다는 장점이 있다.시각화 그래프의 종류선 그래프 (Line Graph)막대 그래프 (Bar Graph)산점도 (Scatter Plot)Matplotlib은 pyplot으로 호출한다.pyplotMatplotlib 라이브러리 호출 방법import numpy as npimport matplotlib.pyplot as plt선 그래프시간의 흐름에 따라서 어떤 값이 어떻게 바뀌었는지 알 수 있는 그래프이다.# 선 그래프 작성 코드plt.plot(array1, a..

프로그래밍 언어/Python2024. 6. 29. 00:20[파이썬 개념 정리 5]Numpy 라이브러리 개념 정리

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)라이브러리데이터 분석 실무에서 많이 활용하는 Toolkit으로, 파이썬에서 필수적인 요소이다.대표적인 라이브러리numpy : 수치적인 연산을 할때 많이 활용함pandas : 데이터를 표 형식으로 정리하고 분석함matplotlib : 데이터의 효과적인 전달을 위해 데이터를 시각화할 때 사용함Numpy(Numerical Python)수치적인 연산에 최적화된 라이브러리이다.(파이썬 도구)수학 연산과 통계 연산이 내장되어 있다.장점 1) 메모리 최적화 2) 연산 최적화numpy이 없이 사용했을 때 상대적으로 복잡한 구현을 numpy로 간단하게 쓸 수 있다.넘파이의 근본이 되는 자료..

300x250
image