Standard population
빅데이터를 분석할 경우, 나이를 고려하여 표준화 작업을 해주어야 하는 경우가 있다. 특히 다른 cohort나 연도 데이터들을 비교할 때, 나이에 따른 weight 를 곱하여 비교하여야 좀 더 정확한 결과를 얻을 수 있다. 이때 사용되는 weight를 정해 놓은 것이 standard population이고, 각 나이 구간의 crude rate에 곱하여 cohort의 motablity 를 구한다. The standard population data files contain the following data: - U.S. Standards (1940, 1950, 1960, 1970, 1980, 1990, 2000) - Canadian Standards (1991, 1996, 2011) - European (S..
2022. 12. 27.
PBWT (Positional Burrows-Wheeler Transform)
Phasing을 위해서 Li and Stephens model (LSM)을 사용한다. LSM의 계산속도를 높이기 위해서, 주어진 genotype에 대해서 가능한 haplotype을 만들어 Positional Burrows-Wheeler Transform (PBWT) 과정을 진행한다. PBWT에 대해 잘 정리된 글이 있어서 이해한 내용을 정리해 본다. # Haplotypes X = [[0, 1, 0, 1, 0, 1], # 0 [1, 1, 0, 0, 0, 1], # 1 [1, 1, 1, 1, 1, 1], # 2 [0, 1, 1, 1, 1, 0], # 3 [0, 0, 0, 0, 0, 0], # 4 [1, 0, 0, 0, 1, 0], # 5 [1, 1, 0, 0, 0, 1], # 6 [0, 1, 0, 1, 1,..
2020. 6. 9.