이번 글은 생물정보학을 위한 기초 지식을 다루며 그 중에 프로그래밍, 통계 및 협업에 대해 다루고 있습니다. 부족한 점이 많겠지만, 너그러운 마음으로 가볍게 읽어주시면 감사하겠습니다.프로그래밍생물정보학을 위한 프로그래밍에는 Python, R, Matlab, Julia, UNIX command가 사용됩니다.Python생물정보학을 위한 파이썬에서는 pandas, numpy, biopython과 같은 라이브러리를 주요하게 보는 것이 좋습니다.numpy와 pandas는 파이썬을 다루는 기초 라이브러리이기 때문에 지금은 biopython에 대한 설명만 간단하게 다루겠습니다.BiopythonBiopython은 생물정보학(생물학적 데이터 분석) 작업을 위한 Python 라이브러리 모음입니다.Biopython은 다양한..
이번 글은 생물정보학을 위한 기초 지식을 다루며 그 중에 데이터 양식에 대해 다루고 있습니다. 부족한 점이 많겠지만, 너그러운 마음으로 가볍게 읽어주시면 감사하겠습니다.데이터 양식생물정보학에서 사용하는 데이터 양식FASTA설명: DNA 및 단백질 서열 정보를 저장하는 기본 파일 형식으로, 설명 행과 서열 데이터로 구성됩니다.FASTQ설명: DNA 서열과 각 염기의 품질 정보를 네 줄로 저장하는 형식으로, 주로 차세대 시퀀싱 데이터에서 사용됩니다.SAM/BAM설명: DNA 서열을 참조 유전체에 매핑한 정보를 저장하는 형식으로, SAM은 텍스트 형식, BAM은 이진 형식입니다.VCF설명: 유전 변이 정보를 위치, 유형, 참고 유전체와의 차이를 포함하여 저장하는 형식입니다.BED설명: 유전자 위치, ChIP-..