이번 글은 내용 공유의 목적이 아닌 scikit-learn 라이브러리에 대해 언제든 내용을 확인할 수 있게 만든 노트 목적의 글입니다.다른 분들도 필요하다면 언제든 참고하셔도 좋습니다.scikit-learn이란?scikit-learn은 Python을 위한 오픈 소스 머신러닝 라이브러리입니다.다양한 분류, 회귀, 클러스터링 알고리즘뿐만 아니라 전처리, 모델 선택 및 평가를 위한 도구들을 제공합니다.단순하면서도 강력한 API 덕분에 데이터 과학자와 엔지니어들이 손쉽게 머신러닝 모델을 구현하고 실험할 수 있습니다.역사 및 배경scikit-learn은 2007년 David Cournapeau가 Google Summer of Code 프로젝트로 시작했습니다.이후 여러 개발자들의 기여를 통해 발전해왔으며, 현재는 ..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)라이브러리데이터 분석 실무에서 많이 활용하는 Toolkit으로, 파이썬에서 필수적인 요소이다.대표적인 라이브러리numpy : 수치적인 연산을 할때 많이 활용함pandas : 데이터를 표 형식으로 정리하고 분석함matplotlib : 데이터의 효과적인 전달을 위해 데이터를 시각화할 때 사용함Numpy(Numerical Python)수치적인 연산에 최적화된 라이브러리이다.(파이썬 도구)수학 연산과 통계 연산이 내장되어 있다.장점 1) 메모리 최적화 2) 연산 최적화numpy이 없이 사용했을 때 상대적으로 복잡한 구현을 numpy로 간단하게 쓸 수 있다.넘파이의 근본이 되는 자료..