'데이터 분석' 태그의 글 목록

프로그래밍 언어/SQL2024. 11. 15. 11:55[SQL 개념 정리 11] 그룹함수

그룹함수SQL에서 ROLLUP, CUBE, GROUPING SETS는 데이터 집계를 확장하여 다양한 차원의 집계 결과를 한 번에 계산할 수 있는 기능입니다. 이를 통해 다차원 분석을 할 때 많은 쿼리를 줄일 수 있어 데이터 요약과 분석에 유용합니다.ROLLUPROLLUP은 GROUP BY와 함께 사용하여 계층적 집계 결과를 계산하는 데 유용합니다.(GROUP BY절에 들어가는 칼럼을 대상으로 하위 그룹피을 수행하는 함수)지정한 열 순서대로 부분 합계를 계산하고, 마지막에 전체 합계를 추가해줍니다.SELECT column1, column2, SUM(column3) AS totalFROM table_nameGROUP BY column1, column2 WITH ROLLUP; 예시:SELECT departme..

프로그래밍 언어/SQL2024. 11. 15. 11:50[SQL 개념 정리 10] 집합연산자

집합연산자SQL에서 집합 연산자(Set Operators)는 두 개 이상의 쿼리 결과를 결합하여 하나의 결과 집합으로 표시할 때 사용됩니다.(두 테이블에 대한 집합 연산(합집합, 교집합 등)을 수행하는 연산자)MySQL에서는 주로 UNION, UNION ALL, INTERSECT, EXCEPT(또는 MINUS) 연산자를 통해 이러한 작업을 수행할 수 있습니다.특정한 기준키 없이 두 테이블의 레코드들에 대해서 합집합과 교집합 연산을 수행하므로 두 테이블의 칼럼 구성, 스키마가 동일해야 합니다.UNIONUNION 연산자는 두 쿼리의 결과 집합을 결합하면서 중복된 데이터를 제거합니다. 결과에는 중복되지 않는 고유한 행만 표시됩니다.UNION을 실행하면, 한쪽 테이블 내에서의 중복까지 제거가 됩니다.SELECT..

프로그래밍 언어/SQL2024. 11. 13. 18:55[SQL 개념 정리 6] WINDOW 함수

WINDOW 함수SQL의 윈도우 함수는 집계와 변환 작업을 특정한 범위(윈도우) 내에서 수행하여, 결과를 집계와는 다르게 각 행에 대해 별도의 값을 반환하는 함수입니다.윈도우 함수를 사용하면 데이터에 대한 누적 합계, 순위, 이동 평균 등을 쉽게 계산할 수 있습니다.윈도우 함수의 개념윈도우 함수는 각 행에 대한 연산을 수행하되, 전체 또는 특정 그룹(윈도우) 내에서 계산을 수행하여 개별 행에 결과를 반환합니다. 이를 통해 누적 합계, 이동 평균, 순위 등을 계산할 수 있으며, 행을 유지하면서 데이터를 분석할 때 유용합니다.행과 행 간의 관계를 나타내는 연산을 쉽게 하기 위한 함수윈도우 함수는 OVER 절을 사용하여 실행되며, 여기서 특정 기준(PARTITION BY, ORDER BY)을 설정하여 원하는 ..

프로그래밍 언어/SQL2024. 11. 13. 14:00[SQL 개념 정리 3] 집계 쿼리

집계 쿼리집계 함수 (Aggregate Functions)SQL의 집계 함수는 여러 행을 하나의 값으로 요약해주는 함수입니다. 집계 함수는 GROUP BY와 함께 자주 사용되며, 데이터를 요약하고 통계적인 정보를 제공할 때 매우 유용합니다. 주요 집계 함수COUNT: 특정 열에 있는 행의 개수를 계산합니다.SUM: 특정 열의 합계를 계산합니다.AVG: 특정 열의 평균값을 계산합니다.MIN: 특정 열의 최소값을 반환합니다.MAX: 특정 열의 최대값을 반환합니다.예시SELECT COUNT(id) AS total_studentsFROM students;이 쿼리는 students 테이블에서 학생의 전체 수를 계산하여 total_students라는 열로 반환합니다.SELECT AVG(age) AS average_..

통계/파이썬을 이용한 통계 기초2024. 10. 31. 08:30[파이썬을 활용한 통계 개념 기초] 11. 독립(Independence)

독립(Independence)독립은 확률 및 통계에서 매우 중요한 개념입니다. 통계를 다룰 때, 사건들이 서로 독립적인지 아니면 의존적인지를 판단하는 것이 매우 중요합니다.독립을 이해하려면 먼저 조건부 확률(Conditional Probability) 개념을 알아야 합니다.조건부 확률과 공식조건부 확률은 한 사건이 주어진 상황에서 다른 사건이 발생할 확률을 의미합니다.여기서:P(A∣B)는 사건 B가 발생한 상황에서 사건 A가 발생할 확률입니다.P(A∩B)는 사건 A와 B가 동시에 발생할 확률입니다.P(B)는 사건 B가 발생할 확률입니다.이 공식은 사건 B가 발생한 조건에서 사건 A가 일어날 가능성을 계산하는 방법을 제시합니다.독립의 정의두 사건이 독립적이라는 것은, 한 사건의 발생이 다른 사건의 발생 확..

프로그래밍 언어/R2024. 9. 27. 08:3020. R에서의 데이터 전처리 및 변환 2️⃣ (데이터 결합 및 집계와 샘플링)

데이터 결합 및 집계 (Data Merging and Aggregation)데이터 결합과 집계는 데이터 전처리 과정에서 매우 중요한 단계로, 여러 데이터 소스를 통합하거나 데이터를 요약하여 분석에 필요한 정보를 추출할 때 사용됩니다. 이 과정은 데이터의 일관성을 유지하고, 분석의 정확성을 높이는 데 필수적입니다.데이터 결합 (Data Merging)데이터 결합은 두 개 이상의 데이터 프레임을 결합하여 하나의 통합된 데이터 세트를 만드는 과정입니다. R에서 데이터 결합은 주로 merge() 함수를 사용하여 수행됩니다. 이 과정은 SQL의 조인(join) 연산과 유사합니다. merge() 함수 merge() 함수는 두 데이터 프레임을 공통 열을 기준으로 결합합니다. 결합 방식에는 내부 조인(inner joi..

프로그래밍 언어/R2024. 9. 13. 08:0017. R을 활용한 기본 통계 1️⃣ (기초 통계 분석 및 확률 분포)

기초 통계 분석은 데이터를 이해하고 설명하기 위한 첫 번째 단계로, 데이터의 주요 특성을 요약하고 시각화하는 데 중점을 둡니다.R 프로그래밍에서는 다양한 기본 함수를 사용해 이러한 분석을 쉽게 수행할 수 있습니다.기초 통계 분석기본 통계량 계산평균(mean): 데이터의 중심 위치를 나타내며, R에서는 mean() 함수를 사용해 계산합니다.mean_value 중앙값(median): 데이터를 크기 순으로 정렬했을 때 중앙에 위치한 값으로, 이상치에 영향을 덜 받습니다. R에서는 median() 함수로 계산합니다.median_value 분산(var) 및 표준편차(sd): 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 나타냅니다. 분산은 var(), 표준편차는 sd() 함수로 계산합니다.variance 범위(r..

프로그래밍 언어/R2024. 9. 10. 18:5516. R에서의 객체 지향 프로그래밍 (Class)

객체 지향 프로그래밍객체(Object)란 무엇인가? 객체는 데이터와 그 데이터에 관련된 함수(동작)를 포함하는 하나의 단위입니다. 예를 들어, 숫자 5는 하나의 객체입니다. 이 숫자 5는 데이터(숫자 값)를 가지고 있으며, 그 데이터에 적용할 수 있는 함수(예: 더하기, 빼기)가 있습니다.R에서 사용되는 대부분의 데이터(벡터, 리스트, 데이터 프레임 등)는 객체라고 생각할 수 있습니다.클래스(Class)란 무엇인가? 클래스는 객체의 청사진입니다. 즉, 특정 유형의 객체들이 어떻게 생기고, 어떤 동작을 할 수 있는지를 정의하는 틀입니다. 예를 들어, 사람(Person)이라는 클래스를 정의하면, 이 클래스를 기반으로 여러 사람 객체(예: John, Alice)를 만들 수 있습니다.객체는 어떤 클래스로 만들어..

1 2 3

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역