프로그래밍/데이터 분석2024. 8. 4. 02:24[데이터 분석 심화 개념] 클러스터링 개념 정리 2️⃣ (K-Means)
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)K-MeansK-Means란?K-Means는 k개의 클러스터로 나누고, 각 클러스터의 중심을 반복적으로 갱신하여 최적의 클러스터 구성을 찾는 알고리즘입니다.K-Means의 기본 개념은 유사한 데이터는 Centroid(중심점)로부터 가까이에 모여있다는 점입니다.k-means 클러스터링 동작 과정Centroid 배치 :클러스터 개수 k를 설정합니다. (예시: k=2)k만큼의 Centroid를 생성하여 임의로 배치합니다.클러스터 형성 :각 데이터와 Centroid 사이의 거리를 계산하여, 가까운 Centroid에 데이터들을 할당하여 클러스터를 형성합니다.Centroid 위치 갱신..