이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)차원 축소란?차원 축소데이터에서 ‘차원’이란 변수의 개수를 의미합니다.변수가 1개인 데이터는 1차원 데이터, 변수가 2개인 데이터는 2차원 데이터, n개인 데이터는 n차원 데이터라고 부릅니다.예를 들어, 고객 정보 데이터에서 변수가 6개인 경우, 각 변수는 고객의 다양한 특성을 나타냅니다.차원이 높은 데이터를 분석에 활용하면 더 많은 정보를 반영한 결과를 얻을 수 있기에 차원이 많은 데이터를 활용할 필요가 있습니다.이렇게 데이터의 차원이 높아지면 많은 정보를 나타낼 수 있지만, 너무 많은 차원은 분석의 정확도를 떨어지는 결과를 불러 일으키며, 이를 ‘차원의 저주’라고 합니다..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)다양한 클러스터링 모델다양한 클러스터링의 종류계층 기반 클러스터링 (Hierarchical Clustering)기본 아이디어: 유사한 데이터를 묶은 클러스터들을 층으로 쌓아가며 클러스터링을 합니다.(계층 구조 바탕)장점: 데이터 간의 관계를 시각화된 결과물을 통해 쉽게 파악할 수 있으며, 원하는 수의 클러스터로 간단하게 구분 가능합니다.밀도 기반 클러스터링 (Density-Based Clustering)기본 아이디어: 밀도가 높은 부분을 같은 클러스터로 묶어 나감. 클러스터 내의 데이터들은 밀집되어 있습니다.장점: 기하학적인 형태의 데이터를 클러스터링할 때 효과적입니다.분포..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)K-MeansK-Means란?K-Means는 k개의 클러스터로 나누고, 각 클러스터의 중심을 반복적으로 갱신하여 최적의 클러스터 구성을 찾는 알고리즘입니다.K-Means의 기본 개념은 유사한 데이터는 Centroid(중심점)로부터 가까이에 모여있다는 점입니다.k-means 클러스터링 동작 과정Centroid 배치 :클러스터 개수 k를 설정합니다. (예시: k=2)k만큼의 Centroid를 생성하여 임의로 배치합니다.클러스터 형성 :각 데이터와 Centroid 사이의 거리를 계산하여, 가까운 Centroid에 데이터들을 할당하여 클러스터를 형성합니다.Centroid 위치 갱신..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)지도학습과 비지도학습지도학습과 비지도학습은 기계학습의 두 가지 주요 방법론입니다. 이들은 데이터를 학습시키는 방식과 목표에 따라 차이점을 가집니다.기계학습은 데이터를 사용하여 모델을 학습시키고 예측, 분류, 패턴 인식 등의 작업을 수행하는 인공지능의 한 분야입니다.기계학습은 주로 세 가지 지도학습, 비지도학습, 그리고 강화학습과 같은 범주로 나눌 수 있습니다.각 범주는 데이터의 라벨링 여부와 학습 방법에 따라 구분됩니다.지도학습지도학습은 라벨이 있는 데이터를 사용하여 모델을 학습시키는 방법(입력 데이터와 정답 레이블이 쌍으로 주어진 데이터를 학습하는 방법)입니다.즉, 각 입..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)이번 글에서는 저번 Tableau 기초 개념 정리 글에서 못다한 Tableau 기초에 대한 내용 정리를 이어서 하려고 합니다.저번 글에서는 Tableau의 다양한 시각화 차트 중에 막대 차트, 라인 차트, 파이 차트, 히스토그램에 대해 주로 설명했었습니다.이번 글에서는 시각화 차트들을 마저 설명한 뒤에 이어 태블로의 분석 기능과 대시보드를 설명하고 태블로의 기초를 마무리하려고 합니다.태블로의 다양한 시각화 차트 그리기박스 플롯박스 플롯을 시각화하는 방법은 분포를 확인할 대상인 측정값 필드를 행에 넣어준 후 차원으로 변환하는 과정이 필요합니다.이 과정을 자세히 설명하면 분포를..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)이번 글은 태블로에 대한 개념을 설명하며, 태블로라고 불리우는 프로그램 설치부터 프로그램을 다루는 기초적인 방법까지 전반적인 내용을 담을 예정입니다.Tableau라는 이름의 프로그램은 Salesforce라는 회사가 제공하는 데이터 시각화 프로그램입니다.태블로(Tableau) 설치 과정태블로 계정 생성하기https://public.tableau.com/app/discover 에 접속합니다.자신이 사용할 성과 이름, 이메일을 입력하고 ‘내 계정 만들기’를 눌러 계정을 생성합니다.생성된 계정의 메일의 수신함으로 이동하여 “Tableau Software 계정 활성화” 라는 제목의 ..