[#14] 스프린트 DA 트랙 23주차 위클리 페이퍼(데이터 조회 및 필터링 쿼리, NULL)
스프린트/위클리페이퍼2024. 11. 20. 09:05[#14] 스프린트 DA 트랙 23주차 위클리 페이퍼(데이터 조회 및 필터링 쿼리, NULL)

위클리 페이퍼는 현재 훈련받고 있는 코드잇 스프린트 데이터 애널리스트 트랙에서 매주마다 훈련생 스스로 프로그래밍 언어, 데이터분석, 통계, 머신러닝 등 특정 주제에 대하여 심화 학습을 할 수 있도록 제출하는 과제입니다.(매주 2~3가지 주제를 스스로 알아보고 학습하여 관련된 내용을 정리하여 후에 취업 활동 간에 경험할 수 있는 기술 면접을 대비함.)22주차에 이어 이번 23주차 위클리 페이퍼의 내용을 소개하겠습니다.  이번 14번째 위클리 페이퍼 주제는1.  데이터베이스 정규화란 무엇인가요? 또, 정규화의 장단점은 무엇인가요?2. 논리적 모델링에서 사용되는 주요 구성 요소인 엔터티, 속성, 관계에 대해 예시를 들어 설명해주세요.1. 데이터베이스 정규화란 무엇인가요? 또, 정규화의 장단점은 무엇인가요? 데..

[SQL 개념 정리 16] SQL을 활용한 데이터 모델링 1️⃣ (데이터 모델링 기초 이해, 데이터 모델링의 구성 요소, 정규화와 비정규화, 데이터베이스 키와 무결성 제약 조건)
프로그래밍 언어/SQL2024. 11. 18. 14:09[SQL 개념 정리 16] SQL을 활용한 데이터 모델링 1️⃣ (데이터 모델링 기초 이해, 데이터 모델링의 구성 요소, 정규화와 비정규화, 데이터베이스 키와 무결성 제약 조건)

데이터 모델링 기초 이해데이터베이스 기본 개념데이터베이스(Database):데이터를 조직적으로 저장하고 관리하는 시스템입니다. 다양한 애플리케이션에서 데이터를 효율적으로 접근하고 조작할 수 있도록 구조화되어 있습니다.데이터베이스는 대량의 데이터를 안전하게 저장하고, 빠르게 접근하여 필요한 정보를 제공하는 데 중요한 역할을 합니다.테이블(Table):테이블은 데이터베이스의 기본 구성 요소로, 행(Row)과 열(Column)로 구성된다.각 행은 데이터의 개별 레코드(예: 한 명의 고객)를 나타내며, 각 열은 특정 속성(예: 고객 이름, 전화번호 등)을 나타냅니다.예시: 고객 테이블에서는 각 행이 고객 한 명의 정보를 포함하고, 열은 고객의 이름, 주소, 전화번호 등을 저장합니다.RDBMS(관계형 데이터베이스..

[파이썬을 활용한 통계 개념 기초] 07. 표준화와 정규화(Standardization and Normalization)
통계/파이썬을 이용한 통계 기초2024. 10. 5. 09:30[파이썬을 활용한 통계 개념 기초] 07. 표준화와 정규화(Standardization and Normalization)

표준화와 정규화는 스케일링 (Scaling) 기법으로, 데이터의 스케일을 조정하여 모델이 특정 변수에 의존하거나 왜곡된 결과를 내는 것을 방지하고, 더 정확한 예측과 분석을 할 수 있게 돕습니다. 특히 머신러닝과 딥러닝에서 자주 사용됩니다.표준화와 정규화표준화 (Standardization)정의 : 데이터의 평균을 0, 표준편차를 1로 변환하는 기법.목적 : 다양한 변수의 분포와 단위가 다를 때, 동일한 기준으로 변환하여 상대적 비교를 용이하게 합니다.수식 :특징 :평균이 0, 표준편차가 1로 맞춰짐.데이터 분포의 모양은 유지하되, 중심을 0으로 맞추고 스케일을 조정하여, 모든 변수들이 동일한 표준편차를 갖게 함.이상치(Outliers)가 있는 데이터에도 강한 내성을 가질 수 있습니다. (평균 중심의 변..

[파이썬 개념 정리 13] Pandas의 DataFrame 마스터하기 3️⃣ (문자 데이터 가공하기, 숫자 데이터 가공하기)
프로그래밍 언어/Python2024. 7. 29. 23:53[파이썬 개념 정리 13] Pandas의 DataFrame 마스터하기 3️⃣ (문자 데이터 가공하기, 숫자 데이터 가공하기)

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)문자 데이터 가공하기대소문자 처리하기데이터프레임을 다루다보면 숫자형 데이터 뿐만 아니라 문자형 데이터 또한 다뤄야 하는 상황을 겪게 됩니다.이러한 상황 속에서, pandas에서는 문자열 데이터를 처리하기 위해 편리한 메소드로 str.upper(), str.lower(), str.title(), str.capitalize() 등과 같은 주요 메소드를 제공합니다.# 데이터프레임에서 문자형 컬럼의 값들의 종류 확인하기df['column_name(categoric)'].unique()# 문자형 컬럼의 값을 확인할 때, 같은 범주인데도 대문자나 소문자로 다르게 표현된 경우, 컴퓨터는..

300x250
image