이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)다양한 클러스터링 모델다양한 클러스터링의 종류계층 기반 클러스터링 (Hierarchical Clustering)기본 아이디어: 유사한 데이터를 묶은 클러스터들을 층으로 쌓아가며 클러스터링을 합니다.(계층 구조 바탕)장점: 데이터 간의 관계를 시각화된 결과물을 통해 쉽게 파악할 수 있으며, 원하는 수의 클러스터로 간단하게 구분 가능합니다.밀도 기반 클러스터링 (Density-Based Clustering)기본 아이디어: 밀도가 높은 부분을 같은 클러스터로 묶어 나감. 클러스터 내의 데이터들은 밀집되어 있습니다.장점: 기하학적인 형태의 데이터를 클러스터링할 때 효과적입니다.분포..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)K-MeansK-Means란?K-Means는 k개의 클러스터로 나누고, 각 클러스터의 중심을 반복적으로 갱신하여 최적의 클러스터 구성을 찾는 알고리즘입니다.K-Means의 기본 개념은 유사한 데이터는 Centroid(중심점)로부터 가까이에 모여있다는 점입니다.k-means 클러스터링 동작 과정Centroid 배치 :클러스터 개수 k를 설정합니다. (예시: k=2)k만큼의 Centroid를 생성하여 임의로 배치합니다.클러스터 형성 :각 데이터와 Centroid 사이의 거리를 계산하여, 가까운 Centroid에 데이터들을 할당하여 클러스터를 형성합니다.Centroid 위치 갱신..