이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)연관 규칙 마이닝Apriori 알고리즘연관 규칙을 찾기 위해 가능한 모든 조합을 시도하는 것은 매우 비효율적입니다. 특히, 상품의 개수가 많아질수록 조합의 수가 기하급수적으로 증가하므로, 이를 다 처리하는 것은 거의 불가능에 가깝습니다. 따라서 가능한 모든 조합을 다 시도하는 무차별 탐색(Brute Force) 방식은 현실적으로 사용하기 어렵습니다.Apriori 알고리즘의 소개상위 조합에서부터 차례로 스캔하면서 특정 조합이 자주 발생하지 않는다면 이의 결과물로 탄생한 후속 조합들까지 모두 후보에서 배제하는 방식의 알고리즘입니다.Apriori 알고리즘을 활용하면 하나의 조합만..
위클리 페이퍼는 현재 훈련받고 있는 코드잇 스프린트 데이터 애널리스트 트랙에서 매주마다 훈련생 스스로 프로그래밍 언어, 데이터분석, 통계, 머신러닝 등 특정 주제에 대하여 심화 학습을 할 수 있도록 제출하는 과제입니다.(매주 2~3가지 주제를 스스로 알아보고 학습하여 관련된 내용을 정리하여 후에 취업 활동 간에 경험할 수 있는 기술 면접을 대비함)8주차에 이어 이번 9주차 위클리 페이퍼의 내용을 소개하겠습니다. 이번 7번째 위클리 페이퍼 주제는1. 장바구니 분석의 다양한 활용 사례를 설명해 주세요. 각 사례에서 얻을 수 있는 비즈니스 인사이트는 무엇인지 구체적으로 설명해 주세요.2. Support, Confidence, Lift 지표의 정의와 각 지표의 중요성을 설명해 주세요. 이 지표들을 해석하는 방법..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)많은 기업들이 데이터의 중요성을 인식하면서, 데이터를 수집하고 저장하는 데에 상당한 노력을 기울이고 있습니다. 하지만 단순히 데이터를 모아두는 것만으로는 비즈니스 성장을 이끌어낼 수 없습니다. 데이터를 효과적으로 활용하기 위해서는 그 안에서 유용한 정보를 추출해내는 과정이 필수적입니다.예를 들어, 마트에서 고객들의 구매 데이터를 단순히 저장해두기만 한다면, 이는 그저 숫자에 불과할 것입니다. 그러나 이 데이터를 체계적으로 분석해 "매년 8월에는 맥주 매출이 전월 대비 150% 증가한다"는 패턴을 발견했다면 어떻게 될까요? 이를 바탕으로 8월에 맥주를 집중적으로 판매하기 위한..