R은 통계 분석과 데이터 시각화를 위한 강력한 프로그래밍 언어이며, 다양한 기능을 추가하기 위해 많은 패키지가 개발되었습니다. 이번 목차에서 이러한 R 패키지에 대한 설명들을 하도록 하겠습니다.
R package 설치 및 불러오기
R package란?
R 패키지는 특정 작업을 수행하기 위한 함수, 데이터, 코드 등을 모아놓은 집합체로 다양한 분야의 분석도구를 제공합니다.
예를 들어, 데이터 시각화 패키지인 ggplot2, 데이터 조작 패키지인 dplyr, 생물정보학 분석을 위한 Bioconductor 등이 있습니다. 각 패키지는 특정 기능을 효율적으로 수행할 수 있도록 도와줍니다.
패키지 설치
R 패키지는 CRAN(Comprehensive R Archive Network)이라는 중앙 저장소에 저장되어 있으며, 이를 통해 쉽게 설치할 수 있습니다.
패키지를 설치하려면 install.packages 함수를 사용합니다.
예를 들어, ggplot2 패키지를 설치하려면 다음과 같이 입력합니다.
install.packages("ggplot2")
패키지 불러오기
설치한 패키지를 사용하려면 R 세션에서 해당 패키지를 불러와야 합니다. 이를 위해 library 함수를 사용합니다.
예를 들어, ggplot2 패키지를 불러오려면 다음과 같이 입력합니다.
library(ggplot2)
패키지를 불러오면 해당 패키지의 함수들을 사용할 수 있게 됩니다.
참고할 만한 패키지들
- tidyverse: 데이터 조작, 시각화, 분석 등을 위한 통합 패키지 모음
- data.table: 고성능 데이터 조작을 위한 패키지
- shiny: 대화형 웹 애플리케이션을 만들기 위한 패키지
- caret: 머신러닝 모델 훈련 및 평가를 위한 패키지
- Bioconductor: 생물정보학 데이터를 분석하기 위한 패키지 모음
package의 종류
Base Package
Base package는 R을 설치할 때 기본적으로 제공되는 패키지로, R의 핵심 기능을 포함합니다. 별도의 설치나 불러오는 과정 없이 바로 사용할 수 있으며, 데이터 조작, 통계 분석, 그래픽 기능 등을 제공합니다.
주요 기능
- 기본 데이터 구조: vector, matrix, data.frame, list 등의 기본적인 데이터 구조를 제공합니다.
- 수학 연산: sum(), mean(), var() 등 기본적인 수학 연산 함수가 포함됩니다.
- 기본 통계 분석: lm() (선형 회귀 모델), cor() (상관계수), t.test() (t-검정) 등 기본적인 통계 분석 함수를 제공합니다.
- 기본 그래픽: plot(), hist(), boxplot() 등 기본적인 그래픽 함수들이 포함됩니다.
# 벡터 생성
v <- c(1, 2, 3, 4, 5)
# 평균 계산
mean_value <- mean(v)
# 선형 회귀 분석
model <- lm(mpg ~ wt, data = mtcars)
# 산점도 그리기
plot(mtcars$wt, mtcars$mpg)
Recommended Packages
R 설치 시 함께 설치되는 패키지들이 있습니다. 이들 패키지는 R에서 기본적으로 제공되지만, 별도로 library() 함수를 사용해 불러와야 합니다. 몇 가지 예시는 다음과 같습니다.
- stats: 통계 분석을 위한 함수들이 포함된 패키지입니다. 예를 들어, 선형 회귀 (lm()), ANOVA (aov()), 시계열 분석 (arima()) 등을 제공합니다.
- graphics: 고급 그래픽을 생성하는 함수들이 포함되어 있습니다. 예를 들어, plot(), hist(), boxplot() 등이 포함됩니다.
- grDevices: 그래픽 장치(디바이스)와 관련된 기능을 제공합니다. 예를 들어, 파일로 그래픽을 출력할 때 사용됩니다.
- utils: 유틸리티 기능들을 제공하는 패키지로, 데이터셋을 읽거나 쓰는 기능 (read.csv(), write.csv()), 작업 디렉토리 설정 (setwd()), 도움말 시스템 (help()) 등을 포함합니다.
# stats 패키지 불러오기
library(stats)
# 시계열 분석
arima_model <- arima(AirPassengers, order = c(1, 1, 1))
# graphics 패키지 불러오기
library(graphics)
# 상자 그림(boxplot) 그리기
boxplot(mpg ~ cyl, data = mtcars)
Contributed Packages
R의 오픈 소스 특성상, 수많은 패키지가 사용자와 개발자에 의해 기여되었습니다. 이들 패키지는 CRAN, Bioconductor, GitHub 등을 통해 제공되며, 다양한 기능을 추가합니다.
몇 가지 예시
- ggplot2: 데이터 시각화를 위한 강력한 패키지로, 복잡한 그래프를 쉽게 생성할 수 있습니다.
- dplyr: 데이터 조작을 간편하게 수행할 수 있는 패키지입니다.
- shiny: 웹 애플리케이션을 개발할 수 있도록 도와주는 패키지입니다.
- caret: 머신러닝 모델 훈련과 평가를 위한 패키지입니다.
# ggplot2 패키지 설치 및 불러오기
install.packages("ggplot2")
library(ggplot2)
# 간단한 시각화 예시
ggplot(mtcars, aes(x = wt, y = mpg)) +
geom_point()
# dplyr 패키지 설치 및 불러오기
install.packages("dplyr")
library(dplyr)
# 데이터 필터링 예시
filtered_data <- mtcars %>% filter(mpg > 20)
추가) 생물정보학 패키지 : Bioconductor Packages
Bioconductor는 생물정보학과 생명과학 데이터 분석을 위한 패키지 모음입니다. 유전자 발현 분석, 유전체 데이터 처리, 단일 세포 RNA 시퀀싱 분석 등 생물학적 데이터를 다루는 데 특화되어 있습니다.
- DESeq2: 차등 발현 유전자 분석을 위한 패키지
- edgeR: RNA-Seq 데이터 분석을 위한 패키지
- GenomicRanges: 유전체 데이터의 범위를 다루기 위한 패키지
# Bioconductor 설치
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
# DESeq2 패키지 설치 및 불러오기
BiocManager::install("DESeq2")
library(DESeq2)
이러한 패키지들은 R의 강력함을 한층 더해 주며, 사용자가 다양한 분석 작업을 효과적으로 수행할 수 있도록 돕습니다.
기본 함수 소개) help 함수와 library 함수
help 함수
help 함수는 R 함수, 패키지, 데이터셋 등의 도움말을 제공합니다. 이를 통해 특정 함수나 패키지의 사용법, 예제, 인자 등에 대한 정보를 얻을 수 있습니다.
사용법
- 함수 도움말 보기: 특정 함수의 도움말을 보려면 help("함수이름") 또는 ?함수이름을 사용합니다.
# 예시: mean 함수의 도움말 보기
help("mean")
# 또는
?mean
- 패키지 도움말 보기: 특정 패키지의 도움말을 보려면 help(package = "패키지이름")을 사용합니다.
# 예시: ggplot2 패키지의 도움말 보기
help(package = "ggplot2")
- 함수의 특정 항목 검색: 함수 이름 일부만 알고 있을 때 help.search("키워드") 또는 ??키워드를 사용하여 관련된 도움말을 검색할 수 있습니다.
# 예시: 회귀 관련 함수 검색
help.search("regression")
# 또는
??regression
library 함수
library 함수는 R에서 특정 패키지를 불러올 때 사용됩니다. 패키지를 불러오면 해당 패키지에 포함된 함수들을 사용할 수 있게 됩니다.
사용법
- 패키지 불러오기: 설치된 패키지를 불러오려면 library("패키지이름")을 사용합니다.
# 예시: ggplot2 패키지 불러오기
library("ggplot2")
- 패키지가 설치되어 있는지 확인: 특정 패키지가 설치되어 있는지 확인하려면 require("패키지이름")을 사용할 수 있습니다.
이 함수는 논리값을 반환하며, 패키지가 설치되어 있지 않으면 경고 메시지를 출력하고 FALSE를 반환합니다.
# 예시: ggplot2 패키지 확인
if (!require("ggplot2")) {
install.packages("ggplot2")
library("ggplot2")
}
- 패키지 목록 보기: 현재 로드된 패키지 목록을 보려면 search() 함수를 사용합니다.
# 예시: 로드된 패키지 목록 보기
search()
예시
밑은 help와 library 함수를 사용하여 패키지 설치, 불러오기 및 도움말을 보는 예시입니다.
# 패키지 설치
install.packages("ggplot2")
# 패키지 불러오기
library("ggplot2")
# ggplot2 패키지의 도움말 보기
help(package = "ggplot2")
# geom_point 함수의 도움말 보기
help("geom_point")
# 또는
?geom_point
# 회귀 관련 함수 검색
help.search("regression")
# 또는
??regression
R은 다양한 패키지를 통해 기본 기능을 확장하고, 분석과 시각화를 더욱 강력하게 수행할 수 있도록 돕습니다. 이 글에서는 패키지 설치와 불러오는 방법, 대표적인 패키지들을 소개했습니다. 이러한 패키지들을 잘 활용하면, 복잡한 데이터 분석 작업을 효율적으로 수행할 수 있습니다. 앞으로도 R의 다양한 패키지들을 탐색하고, 자신의 분석에 적합한 도구를 찾아 활용해 보시길 바랍니다.
감사합니다!
'프로그래밍 언어 > R' 카테고리의 다른 글
06. R 프로그램에서 파일 읽기 및 쓰기 (0) | 2024.08.20 |
---|---|
05. R의 변수와 데이터 타입 및 구조 3️⃣ (array, 데이터 요약 및 시각화, 데이터 타입 확인 및 변환) (0) | 2024.08.17 |
04. R의 변수와 데이터 타입 및 구조 2️⃣ (리스트, 행렬, 데이터프레임) (0) | 2024.08.15 |
03. R의 변수와 데이터 타입 및 구조 1️⃣ (변수와 데이터 타입, 팩터, 벡터) (0) | 2024.08.13 |
01. R의 기초 (R의 개념과 설치, R studio 설치) (1) | 2024.08.09 |
데이터 분석을 공부하고 카페를 열심히 돌아다니는 이야기
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!