![[생물정보학 기초] 04. 유전체 빅데이터의 소개](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FcNmsex%2FbtsIPy0X1OD%2FAAAAAAAAAAAAAAAAAAAAADKc4H47vEqB5I5jdQCY8LNK5lgqJKRMzLNJay4z1K0u%2Fimg.jpg%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1753973999%26allow_ip%3D%26allow_referer%3D%26signature%3DVOQizsQM%252FSJREM66J065M%252B559dk%253D)

이번 글은 유전적 조성과 원인 유전자 탐색에 대한 설명을 통해 생물정보학의 근간이 되는 유전체 빅데이터에 대해 다루고 있습니다.
부족한 점이 많겠지만, 너그러운 마음으로 가볍게 읽어주시면 감사하겠습니다.
유전적 조성
유전체 데이터를 활용한 맞춤형 정밀의료 시대의 시작
유전체 빅데이터를 이용한 맞춤형 정밀의료는 각 개인의 유전체 정보를 분석하여 그 사람에게 최적화된 치료법과 예방 전략을 제공하는 의료 접근 방식입니다.
- 정의 및 개념
- 정밀의료(Precision Medicine): 각 개인의 유전적, 환경적, 생활습관적 차이를 고려하여 최적화된 의료 서비스를 제공하는 접근 방식입니다.
- 맞춤형 의료(Personalized Medicine): 개인의 유전체 정보를 바탕으로 질병 예방, 진단, 치료를 개인화하는 의료 방법입니다.
- 유전체 빅데이터의 역할
- 유전체 데이터 수집 및 분석: 개인의 전체 유전체 시퀀싱 데이터를 포함하여 유전자 변이, 유전자 발현 패턴 등을 분석합니다.
- 데이터 통합: 유전체 데이터 외에도 임상 데이터, 생활습관 정보, 환경적 요인을 통합하여 종합적인 분석을 수행합니다.
- 응용 분야
- 질병 예측 및 예방: 유전체 분석을 통해 특정 질병의 발병 위험을 사전에 예측하고 예방 전략을 수립합니다.
- 정확한 진단: 유전적 특성을 기반으로 보다 정확한 진단이 가능하며, 희귀 질환이나 유전 질환의 진단에 특히 유용합니다.
- 개인 맞춤형 치료: 환자의 유전체 정보를 바탕으로 최적의 약물과 치료법을 선택하여 치료 효과를 극대화하고 부작용을 최소화합니다.
- 약물 유전체학: 개인의 유전적 특성에 따라 약물의 대사, 효과, 부작용을 예측하여 맞춤형 약물 처방이 가능합니다.
- 장점
- 효율성 증대: 개인별로 최적화된 치료를 통해 치료 성공률을 높이고, 불필요한 치료를 줄여 의료 비용을 절감합니다.
- 환자 중심 의료: 환자의 특성을 반영한 맞춤형 접근으로 환자의 만족도와 삶의 질을 향상시킵니다.
- 신약 개발 가속화: 유전체 데이터를 활용한 타겟 발굴과 임상시험 설계로 신약 개발의 효율성을 높입니다.
- 사례 및 발전 현황
- 유전성 암 치료: BRCA1/BRCA2 유전자 변이를 가진 환자에게 맞춤형 치료 제공.
- 약물 반응 예측: 특정 유전자 변이에 따른 항암제 반응 예측 및 치료 전략 수립.
- 희귀 질환 진단: 유전체 분석을 통해 원인 불명 질환의 원인 유전자 규명 및 진단.
- 미래 전망
- 데이터 통합 및 공유: 전 세계적인 유전체 데이터 공유와 협력을 통해 정밀의료의 효과를 극대화.
- 인공지능(AI) 및 머신러닝 활용: 방대한 유전체 데이터를 분석하고 예측 모델을 개발하여 정밀의료의 발전 가속화.
- 개인 정보 보호: 유전체 데이터의 보안 및 프라이버시 보호를 강화하여 신뢰성을 높임.
이와 같이 유전체 빅데이터를 활용한 맞춤형 정밀의료는 개인의 유전적 특성을 고려하여 보다 정확하고 효과적인 의료 서비스를 제공함으로써 의료의 패러다임을 변화시키고 있습니다.
정밀의료를 이끄는 유전체 데이터와 코호트
- 유전체 데이터: 개인의 유전체 정보를 포함하는 데이터로, 전체 유전체 시퀀싱, 전장 엑솜 시퀀싱, 유전자 패널 검사 등이 있습니다. 이 데이터는 질병의 예측, 진단 및 맞춤 치료에 중요한 역할을 합니다.
- 대규모 코호트 연구: 장기간에 걸쳐 다양한 인구 집단의 건강 데이터를 추적하고 분석하는 연구입니다. 유전체 데이터와 함께 임상, 환경, 생활습관 정보를 포함하여 질병의 원인과 치료에 대한 통찰을 제공합니다.
- 역할 및 응용: 유전체 데이터와 코호트 연구는 질병의 원인 규명, 예방 및 조기 진단, 개인 맞춤형 치료, 신약 개발에 기여합니다.
- 사례: UK Biobank, All of Us Research Program, 1000 Genomes Project 등이 대규모 유전체 데이터 및 코호트 연구의 예로, 각기 다양한 인구 집단에서 수집된 건강 및 유전체 데이터를 활용하여 연구를 수행하고 있습니다.
- 미래 전망: 데이터 통합, 인공지능 활용, 개인 정보 보호 강화 등을 통해 연구의 효율성과 정밀성을 높이고, 참여자의 신뢰를 확보하는 방향으로 발전할 것입니다.
이러한 대규모 유전체 데이터와 코호트는 정밀의료의 발전을 이끄는 핵심 요소로, 질병 관리와 치료에 혁신적인 변화를 가져오고 있습니다.
20세기 전,후의 유전학: 멘델, 다윈 ,골턴 그리고 피셔
1. 그레고어 멘델 (Gregor Mendel, 1822-1884)
멘델은 유전의 기본 원칙을 발견하여 유전학의 기초를 마련했습니다.
그는 단일 유전자 쌍에 의해 결정되는 형질(예: 완두콩의 색깔과 모양)을 연구했습니다.
멘델의 법칙은 단순한 유전 패턴을 설명하는 데 매우 유용했지만, 실제로 많은 형질은 단일 유전자로 설명할 수 없는 복잡성을 가지고 있음을 후에 알게 되었습니다.
2. 찰스 다윈 (Charles Darwin, 1809-1882)
다윈의 자연 선택 이론은 생물 종이 어떻게 진화하고 환경에 적응하는지를 설명했습니다.
다윈은 유전적 변이가 자연 선택을 통해 어떻게 집단 내에 퍼질 수 있는지를 설명했지만, 유전의 기작에 대해서는 구체적인 이해가 부족했습니다.
다윈의 이론은 나중에 멘델의 법칙과 결합되어 유전자 변이가 진화에 어떻게 기여하는지 이해하는 데 도움이 되었습니다.
3. 프랜시스 골턴 (Francis Galton, 1822-1911)
골턴은 유전이 인간의 지능과 같은 복잡한 형질에 미치는 영향을 연구했습니다.
그는 이러한 형질이 단일 유전자가 아니라 여러 유전자에 의해 영향을 받을 수 있음을 인지했습니다.
이를 통해 다유전자 형질의 개념이 발전하는 기초를 마련했습니다.
4. 로널드 피셔 (Ronald Fisher, 1890-1962)
피셔는 통계학자이자 유전학자로, 멘델의 유전 법칙과 다윈의 진화론을 통합하여 현대 유전학의 기초를 확립하는 데 기여했습니다.
업적:
- 양적 유전학(Quantitative Genetics): 피셔는 여러 유전자가 복잡한 형질에 기여하는 방식을 설명하는 모델을 개발했습니다. 그는 유전적 변이와 환경적 변이가 형질 표현형에 미치는 영향을 수학적으로 분석했습니다.
- 분산 분석(ANOVA): 피셔는 통계적 방법을 개발하여 유전과 환경이 형질에 미치는 영향을 분리하고 분석했습니다.
- 피셔의 기본 정리: 그는 자연 선택이 유전적 다양성을 통해 어떻게 개체군의 적응도를 증가시키는지를 설명하는 기본 정리를 제안했습니다.
양적 유전 모델:
- 모델의 기본 개념: 피셔의 양적 유전 모델은 형질이 여러 유전자(다유전자)에 의해 영향을 받으며, 각 유전자의 기여는 작지만 누적되어 형질의 변이를 설명할 수 있다고 가정합니다.
- 유전적 분산: 피셔는 형질의 총 변이를 유전적 요인에 의한 분산(유전적 분산)과 환경적 요인에 의한 분산(환경적 분산)으로 나누었습니다.
- 유전력(Heritability): 형질의 유전력은 유전적 분산이 형질의 총 변이에 차지하는 비율을 의미합니다. 높은 유전력은 유전적 요인이 형질에 큰 영향을 미친다는 것을 의미합니다.
영향:
- 피셔의 연구는 멘델 유전학과 다윈의 진화론을 통합하여 유전과 진화의 수리적 기초를 확립했습니다. 이를 통해 다유전자 형질에 대한 이해를 깊게 하고, 현대 유전학 연구의 기초를 마련했습니다.
다유전자 형질 (Polygenic Traits)
다유전자 형질은 여러 유전자에 의해 결정되는 형질을 말합니다. 이는 단일 유전자의 영향으로 설명될 수 없는 복잡한 형질들을 포함합니다. 다음은 다유전자 형질의 주요 특징입니다:
- 여러 유전자의 기여: 다유전자 형질은 여러 유전자가 각기 작은 영향을 미쳐 형질을 결정합니다. 예를 들어, 사람의 키, 피부색, 체질량지수(BMI) 등이 이에 해당합니다.
- 연속적인 변이: 이러한 형질은 연속적인 변이를 나타내며, 다양한 표현형이 스펙트럼 형태로 나타납니다. 예를 들어, 키는 매우 짧은 사람부터 매우 큰 사람까지 연속적으로 분포합니다.
- 환경의 영향: 다유전자 형질은 유전자뿐만 아니라 환경 요인에도 영향을 받습니다. 예를 들어, 영양 상태, 운동 습관 등이 체질량지수에 영향을 미칠 수 있습니다.
현대 유전학에서 다유전자 형질 연구
현대 유전학에서는 다유전자 형질을 연구하기 위해 다양한 접근법을 사용합니다:
- 유전체 연관 연구(GWAS): 대규모 인구 집단을 대상으로 유전자 변이와 특정 형질 간의 연관성을 분석합니다. 이를 통해 여러 유전자가 복잡한 형질에 어떻게 기여하는지 이해할 수 있습니다.
- 다유전자 점수(Polygenic Scores): 개별 유전자 변이의 효과를 종합하여 개인의 특정 형질에 대한 유전적 소인을 예측합니다.
- 환경적 상호작용: 유전자와 환경의 상호작용을 연구하여 어떻게 환경 요인이 유전자 발현과 형질에 영향을 미치는지 분석합니다.
요약
- 멘델: 단일 유전자에 의한 유전 법칙을 발견하여 유전학의 기초를 확립했습니다.
- 다윈: 자연 선택 이론을 통해 진화와 유전적 변이를 설명했습니다.
- 골턴: 복잡한 형질이 여러 유전자에 의해 영향을 받을 수 있음을 인지하여 다유전자 형질 개념의 기초를 마련했습니다.
- 피셔: 멘델 유전학과 다윈의 진화론을 통합하여 양적 유전학과 분산 분석을 개발하고, 다유전자 형질 연구의 수리적 기초를 확립했습니다.
이들의 연구는 다유전자 형질 이해의 토대를 형성했으며, 현대 유전학은 이를 바탕으로 유전자와 환경의 복잡한 상호작용을 연구하여 정밀의료와 개인 맞춤형 치료에 중요한 기여를 하고 있습니다.
주의 사항
- 유전학은 이분법적인 개념이 아니고, 형질/질병은 유전적 요인과 환경적 요인이 모두 기여합니다.
- 유전적 요인은 유전자, 유전 변이와 같다고 생각하면 됩니다.
- 생물정보학에서의 ‘얼마나’의 의미는 양적인 특성을 어떻게 측정할 것인가? 그 측정은 재현되는가에 대한 것입니다.
- 유전체 기술은 양적 유전의 특성을 기술하도록 발전하고 있습니다.
- 다양한 기술들은 각기 다른 맥락에서 역사적으로 발전했으며, 생물정보학을 연구하려면 이 총체적인 흐름을 이해할 필요가 있습니다.
원인 유전자 탐색
기술의 발전에 따라 탐색할 수 있는 유전 변이의 종류 변화
1980년대: Karyotyping -> 염색체 이상
- Karyotyping: 염색체를 현미경으로 관찰하여 염색체의 수와 구조를 분석하는 방법입니다.
- 탐색 가능한 변이: 염색체의 수적 이상(예: 다운 증후군의 삼염색체 21)이나 큰 구조적 변이(예: 염색체 전좌, 결실, 중복 등)를 발견할 수 있습니다.
- 제한점: 현미경으로 관찰 가능한 크기의 큰 변이만 탐색 가능하며, 작은 변이들은 탐지할 수 없습니다.
1990년대: Molecular Cloning -> Linkage Analysis
- Molecular Cloning: 특정 DNA 조각을 복제하여 연구할 수 있는 기술입니다. 이를 통해 특정 유전자나 유전적 마커를 분석할 수 있습니다.
- 분자생물학 기법(제한 효소 등) 도입으로 가족 내에 유전되는 유전자를 찾아냈습니다.
- Linkage Analysis: 가족 내에서 유전적 마커와 질병 형질 간의 연관성을 분석하여 질병 원인 유전자를 찾는 방법입니다.
- 탐색 가능한 변이: 특정 유전자나 유전자 마커와 연관된 단일 유전자 변이(주로 단일 유전자 질환)를 발견할 수 있습니다.(APOE4 (알츠하이머), TP53 (암))
- 제한점: 다유전자 질환이나 환경적 요인이 큰 영향을 미치는 형질에는 적용하기 어렵습니다, 기술적 한계로 하나 혹은 두개 유전 좌위만 연구할 수 있었습니다.(대부분 연구가 재현되지 않았습니다.)
2000년대: 마이크로어레이 -> GWAS (common variants)
- 마이크로어레이: 수십만 개의 단일 염기 다형성(SNP)이나 유전자 발현을 동시에 분석할 수 있는 기술입니다. (양적 유전에 입각한 연구가 본격적으로 시작됨.)
- GWAS (Genome-Wide Association Studies): 대규모 인구 집단을 대상으로 SNP와 특정 형질 간의 연관성을 분석하는 연구 방법입니다.
- 탐색 가능한 변이: 흔한 유전자 변이(common variants)와 질병 또는 형질 간의 연관성을 탐색할 수 있습니다.
- 제한점: 주로 흔한 변이에 초점을 맞추며, 희귀 변이 탐색에는 제한적입니다. 또한, 발견된 연관성이 인과 관계를 나타내지는 않습니다.
2010년대: 엑솜 시퀀싱 (NGS) -> De novo variants
- 엑솜 시퀀싱 (Whole Exome Sequencing, WES): 유전체의 단백질 코딩 부분(엑솜)을 집중적으로 시퀀싱하는 기술입니다. (질환군에 유전 변이가 빈번하게 나타나는 유전자를 찾는 연구)
- 엑솜 (Exome) : 단백질을 생성하는 유전체 부위 (1% 이하의 유전체 부위에 해당합니다.)
- Next-Generation Sequencing (NGS): 대량의 DNA 서열을 빠르게 분석할 수 있는 기술로, 엑솜뿐만 아니라 전체 유전체 시퀀싱에도 사용됩니다. 염기서열 수준에서 유전 변이를 찾으며, 거의 모든 형태의 유전 변이를 확인할 수 있습니다.
- 탐색 가능한 변이: 새로운 돌연변이(de novo variants)를 포함한 다양한 유전자 변이(유전적 조성)를 탐색할 수 있습니다. 이는 특히 자폐 스펙트럼 장애와 같은 복잡한 질환 연구에 유용합니다.
- 제한점: 엑솜 외의 비코딩 영역에서 발생하는 변이를 완전히 분석하지 못하며, 데이터 분석이 복잡하고 비용이 상대적으로 높습니다.
2020년대: 대규모 전장 유전체 데이터 축적 (컨소시엄) -> Rare inherited variants
- 대규모 전장 유전체 데이터 축적 (Consortium-based large-scale whole genome sequencing): 다양한 인구 집단의 전장 유전체 데이터를 대규모로 수집하고 분석하는 프로젝트가 활발히 진행되고 있습니다.
- 탐색 가능한 변이: 희귀 유전 변이(rare inherited variants)를 포함한 거의 모든 종류의 유전자 변이를 탐색할 수 있습니다. 이는 유전적 희귀 질환의 원인을 규명하고, 정밀의료를 구현하는 데 중요한 역할을 합니다.
- 제한점: 방대한 데이터의 저장, 처리, 해석에 대한 기술적, 비용적 한계가 존재합니다.
2010년대부터 현재까지: 국제 협력연구 컨소시엄의 등장
- 국제 협력연구 컨소시엄: 많은 샘플 크기를 확보(대규모 유전체 연구를) 하기 위해 코호트 간에 협력이 시작되었으며, 이는 대형 연구 컨소시엄의 등장을 이끌었습니다.
- 대표적인 컨소시엄 예시: PGC (Psychiatric Genomics Consortium), UK Biobank, iPSYCH, T2D-GENES, ASC (Autism Sequencing Consortium) 등이 있습니다.
- 탐색 가능한 변이: 희귀 변이, 복사수 변이(CNV), 구조적 변이 등 기존에 미확인된 유전 변이의 분석이 가능해졌습니다.
- 전략 및 성과: 첫 번째 발견자가 되기 위한 전략보다는 통계적으로 엄격하고 높은 신뢰도의 유전자, 위치 발견을 수행합니다. 컨소시엄에서 파생된 결과를 바탕으로 후속 연구(실험동물, 기능 연구 등)이 이루어집니다.
- 국제 수준의 코호트 구축: 코호트를 국제 수준에 따라 얼마나 잘 구축하는지가 성공의 관건이 됩니다.
추가된 현대 및 미래 유전 변이 탐색 기술
- 단일 세포 시퀀싱 (Single-Cell Sequencing)
- 단일 세포 수준에서 유전체 및 전사체를 분석하여 개별 세포 간의 이질성을 연구할 수 있습니다. 이는 암 연구나 발생학 연구에 유용합니다.
- 탐색 가능한 변이: 세포 특이적 유전 변이 및 전사체 변이를 탐색하여 조직 내 유전적 다양성과 세포 간 상호작용을 이해할 수 있습니다.
- 공간 전사체학 (Spatial Transcriptomics)
- 조직 내에서 유전자 발현의 공간적 분포를 분석하여 유전 변이와 조직 구조 간의 관계를 연구할 수 있습니다.
- 탐색 가능한 변이: 조직의 특정 영역에서 발생하는 유전 변이를 탐색하여 질병의 병리학적 메커니즘을 이해할 수 있습니다.
- 에피유전체학 (Epigenomics)
- DNA 메틸화, 히스톤 수정 등의 에피유전적 변이를 분석하여 유전자 발현 조절과 관련된 변이를 탐색할 수 있습니다.
- 탐색 가능한 변이: 유전자 발현에 영향을 미치는 에피유전적 변이를 탐색하여 환경과 유전적 요인의 상호작용을 이해할 수 있습니다.
요약
기술의 발전에 따라 탐색할 수 있는 유전 변이의 종류는 더욱 다양해지고 정밀해졌습니다.
초기에는 염색체 수준의 큰 변이를 탐색했지만, 점차 분자 수준으로 내려가 단일 유전자 변이, 흔한 변이, 새로운 돌연변이, 그리고 희귀 유전 변이까지 탐색할 수 있게 되었습니다.
현대의 기술들은 단일 세포 수준의 변이 탐색, 조직 내 유전자 발현의 공간적 분석, 에피유전적 변이 분석 등을 통해 더욱 복잡하고 정밀한 유전 변이 탐색을 가능하게 하고 있습니다.
이러한 기술 발전은 생물정보학의 발전과 함께 원인 유전자를 더욱 정확하고 효율적으로 탐색할 수 있게 해주고 있습니다.
이번 글에서는 유전적 조성과 원인 유전자 탐색을 통한 유전체 빅데이터에 대해 설명하는 시간을 가졌습니다.
이번 글에서 볼 수 있듯이 유전 변이 탐색 기술의 발전은 정밀의료와 맞춤형 치료의 새로운 시대를 열고 있습니다. 앞으로도 계속될 연구와 협력을 통해 더 많은 질병의 비밀이 밝혀지길 기대합니다.
이번 글도 읽어주셔서 감사합니다!
'생물정보학 > 생물정보학 기초' 카테고리의 다른 글
[생물정보학 기초] 06. 생물정보학을 위한 기초 지식 2️⃣ (프로그래밍, 통계, 협업) (0) | 2024.07.30 |
---|---|
[생물정보학 기초] 05. 생물정보학을 위한 기초 지식 1️⃣ (데이터 양식) (0) | 2024.07.30 |
[생물정보학 기초] 03. 생물정보학의 개요 3️⃣ (알고리즘, 방법론, 시각화, 미래 전망, 추천 도서 및 자료) (0) | 2024.07.27 |
[생물정보학 기초] 02. 생물정보학의 개요 2️⃣ (기본 개념, 용어, 데이터베이스, 도구, 분석 기법, 응용 분야) (0) | 2024.07.27 |
[생물정보학 기초] 01. 생물정보학의 개요 1️⃣ (생물정보학이란?) (0) | 2024.07.26 |

데이터 분석을 공부하고 카페를 열심히 돌아다니는 이야기
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!