프로그래밍 언어/R2024. 8. 13. 23:0103. R의 변수와 데이터 타입 및 구조 1️⃣ (변수와 데이터 타입, 팩터, 벡터)

변수와 데이터 타입은 R 프로그래밍의 가장 기본적인 개념입니다. 데이터를 저장하고 조작하기 위해서는 변수를 사용해야 하며, 각 변수는 특정한 데이터 타입을 가집니다. 데이터 타입을 정확히 이해하면, 데이터를 올바르게 처리하고 분석할 수 있습니다.변수 할당 및 사용법변수란 무엇인가?변수는 데이터를 저장하는 공간으로 나중에 이 값을 사용하거나 조작할 수 있게 해줍니다. 변수에 값을 할당하면, R은 해당 값을 메모리에 저장하고 그 값을 참조할 수 있는 이름(변수명)을 부여합니다.변수명은 사용자가 정의할 수 있으며, 변수에 값을 할당하는 방식은 다음과 같습니다.변수 할당 방법R에서 변수를 할당하는 방법은 두 가지가 있습니다:할당 연산자 : 가장 일반적인 변수 할당 방법입니다.예: x 이 코드에서 숫자 10이 변..

[데이터 분석 심화 개념] 장바구니 분석 개념 정리 1️⃣ (장바구니 분석의 개념, 연관 규칙 마이닝의 개념과 규칙 평가 지표)
프로그래밍/데이터 분석2024. 8. 12. 23:07[데이터 분석 심화 개념] 장바구니 분석 개념 정리 1️⃣ (장바구니 분석의 개념, 연관 규칙 마이닝의 개념과 규칙 평가 지표)

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)많은 기업들이 데이터의 중요성을 인식하면서, 데이터를 수집하고 저장하는 데에 상당한 노력을 기울이고 있습니다. 하지만 단순히 데이터를 모아두는 것만으로는 비즈니스 성장을 이끌어낼 수 없습니다. 데이터를 효과적으로 활용하기 위해서는 그 안에서 유용한 정보를 추출해내는 과정이 필수적입니다.예를 들어, 마트에서 고객들의 구매 데이터를 단순히 저장해두기만 한다면, 이는 그저 숫자에 불과할 것입니다. 그러나 이 데이터를 체계적으로 분석해 "매년 8월에는 맥주 매출이 전월 대비 150% 증가한다"는 패턴을 발견했다면 어떻게 될까요? 이를 바탕으로 8월에 맥주를 집중적으로 판매하기 위한..

02. R package 기초
프로그래밍 언어/R2024. 8. 10. 17:1802. R package 기초

R은 통계 분석과 데이터 시각화를 위한 강력한 프로그래밍 언어이며, 다양한 기능을 추가하기 위해 많은 패키지가 개발되었습니다. 이번 목차에서 이러한 R 패키지에 대한 설명들을 하도록 하겠습니다.R package 설치 및 불러오기R package란?R 패키지는 특정 작업을 수행하기 위한 함수, 데이터, 코드 등을 모아놓은 집합체로 다양한 분야의 분석도구를 제공합니다.예를 들어, 데이터 시각화 패키지인 ggplot2, 데이터 조작 패키지인 dplyr, 생물정보학 분석을 위한 Bioconductor 등이 있습니다. 각 패키지는 특정 기능을 효율적으로 수행할 수 있도록 도와줍니다.패키지 설치R 패키지는 CRAN(Comprehensive R Archive Network)이라는 중앙 저장소에 저장되어 있으며, 이를..

01. R의 기초 (R의 개념과 설치, R studio 설치)
프로그래밍 언어/R2024. 8. 9. 20:2201. R의 기초 (R의 개념과 설치, R studio 설치)

R이란?R은 통계 분석과 그래프 작성 및 데이터 과학에 특화된 프로그래밍 언어이자 개발 환경입니다.생물정보학은 생물학적 데이터를 분석하고 해석하는 학문으로, 유전자 서열, 단백질 구조, 유전자 발현 데이터 등 다양한 형태의 데이터를 다룹니다.R은 이러한 데이터의 분석을 효율적으로 수행할 수 있도록 다양한 패키지와 기능을 제공합니다.역사와 배경R은 1990년대 중반 뉴질랜드 오클랜드 대학교의 로스 이하카(Ross Ihaka)와 로버트 젠틀맨(Robert Gentleman)에 의해 개발되었습니다.이름 'R'은 개발자 이름의 첫 글자에서 따온 것이며, 통계 계산 소프트웨어인 'S' 언어에서 영향을 받았습니다.특징오픈 소스: R은 GNU GPL 라이선스 하에 무료로 제공됩니다.강력한 패키지 시스템: CRAN(C..

프로그래밍/Git2024. 8. 8. 21:00Git 협업하기 개념 정리 2️⃣ (코드 리뷰, 브랜치 관리 전략, 협업 자동화)

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)코드 리뷰코드 리뷰 문화코드 리뷰의 중요성1. 트럭 팩터 증가트럭 팩터(또는 버스 팩터)는 프로젝트의 핵심 지식을 얼마나 많은 개발자가 공유하고 있는지를 나타내는 지표입니다. 트럭 팩터가 ‘1’인 프로젝트는 한 명의 개발자만이 중요한 지식을 가지고 있다는 의미입니다. 만약 그 개발자가 프로젝트에서 떠난다면, 프로젝트는 큰 위험에 처할 수 있습니다. 코드 리뷰는 이러한 문제를 완화하는 데 중요한 역할을 합니다. 코드 리뷰를 통해 모든 팀원이 서로의 코드를 검토하고 이해할 수 있게 되면, 트럭 팩터가 증가하여 프로젝트의 안정성이 높아집니다.2. 코드 품질 향상코드 리뷰는 코드 ..

[#6] 스프린트 DA 트랙 8주차 위클리 페이퍼(차원 축소, 고유값과 고유벡터, 히스토그램의 단점과 그 대안)
스프린트/위클리페이퍼2024. 8. 8. 00:50[#6] 스프린트 DA 트랙 8주차 위클리 페이퍼(차원 축소, 고유값과 고유벡터, 히스토그램의 단점과 그 대안)

위클리 페이퍼는 현재 훈련받고 있는 코드잇 스프린트 데이터 애널리스트 트랙에서 매주마다 훈련생 스스로 프로그래밍 언어, 데이터분석, 통계, 머신러닝 등 특정 주제에 대하여 심화 학습을 할 수 있도록 제출하는 과제입니다.(매주 2~3가지 주제를 스스로 알아보고 학습하여 관련된 내용을 정리하여 후에 취업 활동 간에 경험할 수 있는 기술 면접을 대비함)6,7주차는 프로젝트로 위클리페이퍼를 작성하지 않았으며, 이번 8주차부터 다시 6번째 위클리페이퍼를 이어서 작성하게 되었습니다. 이번 6번째 위클리 페이퍼 주제는1. 데이터 간의 유사도를 계산할 때, feature의 수가 많다면(예: 100개 이상), 이러한 high-dimensional clustering 문제를 해결하기 위한 방법들을 설명해 주세요. 2. 고..

생물정보학/생물정보학 기초2024. 8. 7. 20:08[생물정보학 기초] 07. 생물정보학의 미래 기술 동향

이번 글은 생물정보학의 다양한 기술을 다루며 현재와 미래에서 주요하게 적용할 수 있는 기술에 대해 다루고 있습니다. 부족한 점이 많겠지만, 너그러운 마음으로 가볍게 읽어주시면 감사하겠습니다.현재 생물정보학의 발전 단계현재 생물정보학은 빠르게 발전하고 있으며, 다양한 연구와 기술이 융합되어 중요한 진보를 이루고 있습니다.생물정보학의 발전 단계를 몇 가지 주요 영역으로 나누어 밑에서 설명하겠습니다.데이터 생성 및 수집고속 유전체 시퀀싱 기술 발전으로 대규모 유전체 데이터 생성다중오믹스 데이터 수집 능력 향상데이터 저장 및 관리Ensembl, NCBI, UCSC Genome Browser 등 대형 데이터베이스 구축클라우드 컴퓨팅을 통한 대규모 데이터 저장 및 분석데이터 분석 및 해석유전체 정렬 및 분석 알고리..

프로그래밍/Git2024. 8. 6. 23:16Git 협업하기 개념 정리 1️⃣ (Git을 통한 협업)

이번 글은 코드잇 강의를 수강하면서 배운 내용을 주로 하여 정리되어 있습니다. (코드잇 스프린트 데이터 애널리스트 트랙 1기 훈련생)Git을 통한 협업Git을 통한 협업 개요협업 과정은 프로젝트 규모가 작을 때는 문제가 없지만, 프로젝트의 규모가 커지다 보면 협업 과정 중에서 여러 문제들이 발생합니다.협업에 관해 문제들이 발생하고 이를 해결하지 못한다면, 프로젝트 참여자들의 생산성이 눈에 띄게 낮아지고, 프로젝트의 성공 여부도 불투명해지게 됩니다.협업 실패의 원인Git과 GitHub에 대한 이해 부족: 이 도구들은 소스 코드 버전 관리와 협업을 효율적으로 관리하기 위해 필수적입니다. 그러나 이를 제대로 사용하지 못하면 코드 충돌, 버그 발생, 브랜치 관리 실패 등의 문제가 발생합니다.커뮤니케이션 스킬 부..

300x250
image