본문 바로가기

전체 글11

Kchip의 AX-ID -> RS-ID로 변경 SNP의 명명은 어떤 회사의 chip을 사용했는지에 따라 다릅니다. Kchip은 axiom 사로 알고 있고, 그래서 SNP의 ID가 "AX-" 로 시작되게 됩니다. 이것을 일반적으로 dbSNP에서 사용하는 rsID로 변경해야 합니다. 보통은 chip 홈페이지에 들어가면, 관련된 csv 파일등이 있는데 Kchip은 아무리 뒤져도 나오지 않아 고생을 했습니다. 홈페이지 보고 메일을 보내도 답장도 없구요 ^^  우리는 ANNOVAR를 이용할 겁니다. ANNOVAR에 대해서는 구글 검색해서 찾아보시면 되고 대부분 gene, SNP 등을 annotation 할 때 가장 많이 사용합니다. 사용하기 전에 개발자에게 사용하고 싶다고 등록을 하면 금방 답이 오고 다운받으실 수 있습니다. 굉장히 좋은 툴이니 꼭 받아둡시다.. 2023. 4. 25.
R에서 liftover 시행하기. R에서 liftOver 시행하는 방법입니다. 다른 파일들을 liftOver로 변경하는 방법은 인터넷에 좀 나와있는데 GWAS summary statistics를 liftOver로 변경하는 방법은 없길래 기록 남깁니다. eQTL catalog 홈페이지에서 발견하였습니다. 우선 GenomicRanges, rtracklayer 패키지가 있어야 합니다. 우선 summary statistics를 불러옵니다. 예를 들어 저는 Pattaro et al.의 Nature communications에 출판된, eGFR과 관련된 summary statistics를 불러올 겁니다. # 불러옵니다. fread("~/driveD/R_projects/CKD_AD/0_GWAS_summary/pattaro_h.tsv.gz") -> e.. 2023. 4. 25.
Plink로 GWAS summary statistics clumping GWAS summary statistics 데이터를 활용하여 plink로 clumping을 할 수 있습니다. 이 때 reference는 보통 사용하는 1000G reference 데이터를 활용하면 됩니다.  코드 plink \--bfile ~/driveD/ref_gene/magma_data/reference_data/european/g1000_eur \--clump-p1 5e-8 \--clump-r2 0.05 \--clump-kb 1000 \--clump gwas_eGFR.tsv \--clump-snp-field SNP \--clump-field P \--threads 18 \--out gwas_eGFR_Pattaro  하나씩 설명하면, --bfile: g1000_eur 라고 하는 plink 파일(bim.. 2023. 4. 14.
Alzheimer's disease, GWAS & eQTL 분석 (4) coloc 분석 coloc은 colocalization을 분석하는 패키지 입니다. 자세한 사항은 관련 논문 참조해 주세요 쉽게 설명하면 GWAS의서의 summary statistics, eQTL에서의 summary statistics를 이용해서 abf를 계산하는 것이라고 합니다. 자 이제 coloc 패키지의 coloc.abf를 이용해서 자동으로 분석해 보도록 합시다. 자동화를 위하여 함수를 만들어야 합니다. automated_coloc % filter(target == target_SNP), by = c("CHR","BP"), suffix = c("_eqtl", "_gwas") ) -> merged_data merged_data %>% filter(!is.na(MAF_gwas)) -> merged_data if (NRO.. 2022. 12. 19.