본문 바로가기

Bi5

GATK Variant calling을 위해서 GATK를 사용해 보았다. 공식 : https://gatk.broadinstitute.org/hc/en-us 다운로드 : https://github.com/broadinstitute/gatk/releases $ wget https://github.com/broadinstitute/gatk/releases/download/4.1.8.1/gatk-4.1.8.1.zip $ unzip gatk-4.1.8.1.zip $ cd gatk-4.1.8.1 $ ./gatk 압축을 풀고 나서 설치과정 없이 바로 사용 가능하다. 준비과정으로 reference fasta file의 dictionary만드는 과정이 필요하다. $ samtools faidx hg37.fa # generate i.. 2020. 8. 7.
Genetic map Genome mapping에는 Physical map과 Genetic map으로 두 가지가 있다. Physical map은 DNA sequence의 base pair 단위의 실제 거리를 바탕으로 측정한 것이고, genetic map은 genetic linkage information에 따라 mapping한 거리이다. Phenotype에 따라 유전자의 특성을 반영하여 관련있는 유전자를 묶으면 genetic map이 된다. Genetic map - Shapeit4를 실행시 필요한 genetic map은 github respository에서 제공하고 있다. Impute5를 실행할때도 같은 genetic map을 사용하면 된다. Mandatory in v4.0. In v4.1, constant rate of 1.. 2020. 7. 31.
Shapeit4 Phasing을 위한 tool이 많이 있지만, shapeit4에 대해서 정리해 본다. 공식 홈페이지(https://odelaneau.github.io/shapeit4/)가 있으며, source code는 github(https://github.com/odelaneau/shapeit4)에 있다. Shapeit4의 설치를 위해서는 몇 가지 library가 필요하다. - HTSlib: A great C library for reading/writing high-throuhput sequencing data. - BOOST: A free peer-reviewd portable C++ source libraries. SHAPEIT4 uses two specific BOOST libraries: iostreams .. 2020. 7. 9.
Coalescent theory Population genetics 글에 이어 Coalescent theory에 대해서 자세히 알아보자. Wikipedia에 따르면, Coalescent theory란 모집단에서 표본으로 추출한 유전자 변형이 어떻게 공통의 조상으로부터 비롯되었을 수 있는지를 보여주는 model이다. 가장 간단한 경우, coalescent theory는 no recombination, no natural selection, no gene flow, no population structure를 가정하며, 이는 각 변종이 한 세대에서 다음 세대로 똑같이 전해졌을 가능성이 크다는 것을 의미한다. 알아야 할 점은, coalescent theory는 tree reconstruction method가 아니라 sampling meth.. 2020. 6. 26.
Population genetics 집단유전학의 이론은 다음과 같이 나눌 수 있다. 1. Hardy-Weinberg principle 2. Wright-Fisher model (forward in time) 3. Coalescent model (backward in time) 1. Hardy-Weinberg principle : Infinite population size에서 모집단의 대립유전자와 유전자형 빈도수는 다른 진화적 영향(evolutionary influences)이 없는 경우 세대에 따라 일정하게 유지될 것이다 (Mendelian inheritance). 여기서 가정이라고 할 수 있는 진화적 영향으로는 genetic drift, mate choice, assortative mating, natural selection, sex.. 2020. 6. 25.