본문 바로가기

GWAS & fine mapping8

KoGES imputation (2) - QC 및 filtering #1 Imputation은 아래 내용 참조하여 시행하셨을 겁니다. https://nephro.tistory.com/11 KoGES imputation (1)한국인 유전체 역학조사사업 (KoGES) genotype data를 imputation하는 과정입니다. KoGES는 KARE (안산안성), CAVAS, HEXA cohort로 구성되어 있습니다. 가장 처음 genotype 된 KARE는 8840명이고, 이것은 1000 G로 imputationephro.tistory.com  이제 imputed 라는 디렉토리 안에 imputation 된 파일들이 존재할 것입니다. 예를 들어 log 파일 하나를 보도록 하겠습니다. 저는 root ID로 작업을 하도록 bash file을 만들었는데, nas에서 작업이 이루어지기 .. 2024. 8. 26.
KoGES imputation (1) 한국인 유전체 역학조사사업 (KoGES) genotype data를 imputation하는 과정입니다. KoGES는 KARE (안산안성), CAVAS, HEXA cohort로 구성되어 있습니다. 가장 처음 genotype 된 KARE는 8840명이고, 이것은 1000 G로 imputation된 데이터를 같이 줍니다. (정확히는 같이 신청할 수 있습니다) 그리고 KCHIP ver 1.0으로 만들어진 7만여명의 데이터는 5000여명의 KARE, 그리고 HEXA 5만여명, CAVAS 만여명으로 구성되어 있습니다. 처음에 받으면 map, ped 파일로 되어있습니다. 그런데 1000 genome으로 imputation 된 데이터 imputation이 굉장히 오래되어서 좀 이상한 부분이 많고 KCHIP은 imput.. 2023. 11. 17.
Kchip의 AX-ID -> RS-ID로 변경 SNP의 명명은 어떤 회사의 chip을 사용했는지에 따라 다릅니다. Kchip은 axiom 사로 알고 있고, 그래서 SNP의 ID가 "AX-" 로 시작되게 됩니다. 이것을 일반적으로 dbSNP에서 사용하는 rsID로 변경해야 합니다. 보통은 chip 홈페이지에 들어가면, 관련된 csv 파일등이 있는데 Kchip은 아무리 뒤져도 나오지 않아 고생을 했습니다. 홈페이지 보고 메일을 보내도 답장도 없구요 ^^  우리는 ANNOVAR를 이용할 겁니다. ANNOVAR에 대해서는 구글 검색해서 찾아보시면 되고 대부분 gene, SNP 등을 annotation 할 때 가장 많이 사용합니다. 사용하기 전에 개발자에게 사용하고 싶다고 등록을 하면 금방 답이 오고 다운받으실 수 있습니다. 굉장히 좋은 툴이니 꼭 받아둡시다.. 2023. 4. 25.
Plink로 GWAS summary statistics clumping GWAS summary statistics 데이터를 활용하여 plink로 clumping을 할 수 있습니다. 이 때 reference는 보통 사용하는 1000G reference 데이터를 활용하면 됩니다.  코드 plink \--bfile ~/driveD/ref_gene/magma_data/reference_data/european/g1000_eur \--clump-p1 5e-8 \--clump-r2 0.05 \--clump-kb 1000 \--clump gwas_eGFR.tsv \--clump-snp-field SNP \--clump-field P \--threads 18 \--out gwas_eGFR_Pattaro  하나씩 설명하면, --bfile: g1000_eur 라고 하는 plink 파일(bim.. 2023. 4. 14.