위클리 페이퍼는 현재 훈련받고 있는 코드잇 스프린트 데이터 애널리스트 트랙에서 매주마다 훈련생 스스로 프로그래밍 언어, 데이터분석, 통계, 머신러닝 등 특정 주제에 대하여 심화 학습을 할 수 있도록 제출하는 과제입니다.(매주 2~3가지 주제를 스스로 알아보고 학습하여 관련된 내용을 정리하여 후에 취업 활동 간에 경험할 수 있는 기술 면접을 대비함.)24주차에 이어 이번 25주차를 마지막으로 마지막 위클리 페이퍼의 내용을 소개하겠습니다. 이번 16번째 마지막 위클리 페이퍼 주제는1. On-premise, Cloud, Serverless 데이터 웨어하우스의 특징에 대해 각각 설명해주세요.2. BigQuery에서 쿼리 성능을 최적화할 수 있는 방법에 대해 설명해주세요.1. On-premise, Cloud, ..
위클리 페이퍼는 현재 훈련받고 있는 코드잇 스프린트 데이터 애널리스트 트랙에서 매주마다 훈련생 스스로 프로그래밍 언어, 데이터분석, 통계, 머신러닝 등 특정 주제에 대하여 심화 학습을 할 수 있도록 제출하는 과제입니다.(매주 2~3가지 주제를 스스로 알아보고 학습하여 관련된 내용을 정리하여 후에 취업 활동 간에 경험할 수 있는 기술 면접을 대비함.)23주차에 이어 이번 24주차 위클리 페이퍼의 내용을 소개하겠습니다. 이번 15번째 위클리 페이퍼 주제는1. DAG와 Task의 관계에 대해 예시를 들어 설명해주세요.2. 수업시간에서 배우지 않은 Operator들의 종류와 활용 사례를 설명해주세요.1. DAG와 Task의 관계에 대해 예시를 들어 설명해주세요.데이터 엔지니어링이나 워크플로 자동화에 대해 이야..
이번 포스팅은 코드잇 스프린트 데이터 애널리스트 트랙 미션 15의 일환으로, 가상의 서비스 "Fandom-K"를 기반으로 데이터베이스 설계와 구현 과정을 실습한 내용을 정리한 것입니다.Fandom-K는 K-pop 아티스트와 팬을 연결하는 글로벌 조공 플랫폼입니다. 아직 서비스는 개발되지 않았으며, 와이어프레임(Wireframe)만 존재하는 상태에서, 데이터 인프라 설계를 담당하는 데이터 엔지니어의 역할을 맡아 데이터베이스를 설계하고 MySQL을 활용해 구현하는 과정을 진행했습니다. 🎵0. 미션 개요이번 미션은 데이터 모델링과 데이터베이스 구축 실습에 중점을 둡니다. 아래와 같은 단계를 통해 데이터베이스 설계와 구현을 체험했습니다.1. ERD 다이어그램 설계서비스 소개를 기반으로 필요한 테이블을 정의하고..
위클리 페이퍼는 현재 훈련받고 있는 코드잇 스프린트 데이터 애널리스트 트랙에서 매주마다 훈련생 스스로 프로그래밍 언어, 데이터분석, 통계, 머신러닝 등 특정 주제에 대하여 심화 학습을 할 수 있도록 제출하는 과제입니다.(매주 2~3가지 주제를 스스로 알아보고 학습하여 관련된 내용을 정리하여 후에 취업 활동 간에 경험할 수 있는 기술 면접을 대비함.)18주차에 이어 이번 19주차 위클리 페이퍼의 내용을 소개하겠습니다. 이번 12번째 위클리 페이퍼 주제는1. 모델 학습 시 발생할 수 있는 편향과 분산에 대해 설명하고, 두 개념의 관계에 대해 설명해 주세요.2. K-폴드 교차 검증에서 K의 값을 선택할 때 고려해야 할 점은 무엇인가요?1. 모델 학습 시 발생할 수 있는 편향과 분산에 대해 설명하고, 두 개념의..
위클리 페이퍼는 현재 훈련받고 있는 코드잇 스프린트 데이터 애널리스트 트랙에서 매주마다 훈련생 스스로 프로그래밍 언어, 데이터분석, 통계, 머신러닝 등 특정 주제에 대하여 심화 학습을 할 수 있도록 제출하는 과제입니다.(매주 2~3가지 주제를 스스로 알아보고 학습하여 관련된 내용을 정리하여 후에 취업 활동 간에 경험할 수 있는 기술 면접을 대비함.)17주차에 이어 이번 18주차 위클리 페이퍼의 내용을 소개하겠습니다. 이번 11번째 위클리 페이퍼 주제는1. 지도 학습과 비지도 학습의 차이는 무엇인가요?2. 손실 함수(loss function)란 무엇이며, 왜 중요한가요?1. 지도 학습과 비지도 학습의 차이는 무엇인가요?기계학습의 개념 기계 학습의 정의:기계 학습은 데이터를 사용해 컴퓨터가 명시적인 프로그래..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)로그 설계 시작하기User Property와 Event Property User Property(유저 프로퍼티)정의:User Property는 특정 시점에서의 유저 특성을 나타내는 정보입니다.User Property의 종류:서비스용 데이터베이스에 저장된 정보: 나이, 성별, 멤버십 정보 등. 이러한 정보는 서비스 운영에 필수적이며, 별도의 로그 설계가 필요하지 않습니다.로그 설계가 필요한 정보: 시점별로 변화하는 유저 특성 정보(예: 로그인 상태, 유입 채널 등). 이러한 정보는 특정 시점에 기록되어야 하므로 로그 설계가 필요합니다.User Property 설계의 특징:Us..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)로그 설계와 사용자 행동 데이터 분석웹 서비스 운영에서 사용자 행동 데이터를 체계적으로 기록하고 분석하는 것은 프로덕트 개선에 필수적입니다.로그 데이터는 미리 체계적으로 기록되지 않으면 나중에 분석할 때 사용할 수 없으므로, 초기 설계 단계에서부터 로그 설계가 중요합니다. 로그 설계의 중요성:사용자 행동 데이터를 분석하려면 체계적으로 데이터를 기록하는 로그 설계가 필요합니다.로그 설계는 데이터를 어떻게 기록할지 기준을 설정하는 과정으로, 프로덕트 개선을 위한 첫걸음입니다.로그 설계의 비유:로그 설계는 유치원 선생님이 아이들의 행동을 체계적으로 관찰 일지에 기록하는 것과 유사..
이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)A/B 테스트 결과 분석하기결론 도출하기(결과 분석 및 성과 판단 가이드)A/B 테스트 실험 기간이 끝나면 A 그룹과 B 그룹 간의 성과를 평가해야 합니다. 이 과정에서는 각 그룹별로 설정된 성공 지표를 비교하고, 그 차이가 통계적으로 유의미한지 판단하는 것이 중요합니다. 1. 전환율 계산전환율 확인: 각 그룹에 노출된 사용자 수를 분모로, 총 이벤트를 일으킨 사용자 수를 분자로 하여 전환율을 계산합니다.예: 클릭 수 대신 클릭 전환율, 주문 수 대신 주문 전환율 등 상대적인 전환율을 확인합니다.2. 개선율 계산그룹 간 비교: 그룹 A 대비 그룹 B의 성과 개선율을 계산합니..