프로그래밍/데이터 분석2024. 8. 4. 02:27[데이터 분석 심화 개념] 클러스터링 개념 정리 3️⃣ (다양한 클러스터링 모델)

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)다양한 클러스터링 모델다양한 클러스터링의 종류계층 기반 클러스터링 (Hierarchical Clustering)기본 아이디어: 유사한 데이터를 묶은 클러스터들을 층으로 쌓아가며 클러스터링을 합니다.(계층 구조 바탕)장점: 데이터 간의 관계를 시각화된 결과물을 통해 쉽게 파악할 수 있으며, 원하는 수의 클러스터로 간단하게 구분 가능합니다.밀도 기반 클러스터링 (Density-Based Clustering)기본 아이디어: 밀도가 높은 부분을 같은 클러스터로 묶어 나감. 클러스터 내의 데이터들은 밀집되어 있습니다.장점: 기하학적인 형태의 데이터를 클러스터링할 때 효과적입니다.분포..

[데이터 분석 심화 개념] 클러스터링 개념 정리 2️⃣ (K-Means)
프로그래밍/데이터 분석2024. 8. 4. 02:24[데이터 분석 심화 개념] 클러스터링 개념 정리 2️⃣ (K-Means)

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)K-MeansK-Means란?K-Means는 k개의 클러스터로 나누고, 각 클러스터의 중심을 반복적으로 갱신하여 최적의 클러스터 구성을 찾는 알고리즘입니다.K-Means의 기본 개념은 유사한 데이터는 Centroid(중심점)로부터 가까이에 모여있다는 점입니다.k-means 클러스터링 동작 과정Centroid 배치 :클러스터 개수 k를 설정합니다. (예시: k=2)k만큼의 Centroid를 생성하여 임의로 배치합니다.클러스터 형성 :각 데이터와 Centroid 사이의 거리를 계산하여, 가까운 Centroid에 데이터들을 할당하여 클러스터를 형성합니다.Centroid 위치 갱신..

300x250
image