본문 바로가기
GWAS & fine mapping

Alzheimer's disease, GWAS & eQTL 분석 (1) introduction

by 네프로 2022. 12. 19.

임상의로, GWAS, eQTL, Chromatin interaction 등 독학하면서 X같이 고생했던 내용들을 정리합니다.

 

혹시나 관심 있을 다른 선생님들에게나, 분명 까먹었을 미래의 저를 위해 작성합니다.

 

모든 분석은 공짜 데이터를 활용합니다.

 

리눅스 필수이며, 어느 정도 R 지식이 있어야 합니다.

 

 

 

 

1. GWAS catalogue에서 GWAS summary data 다운로드

 

우선 GWAS catalog에 접속하여, GWAS summary data를 다운로드 받습니다.

 

https://www.ebi.ac.uk/gwas/

 

GWAS Catalog

As of , the GWAS Catalog contains publications and associations. GWAS Catalog data is currently mapped to Genome Assembly and dbSNP Build .

www.ebi.ac.uk

 

로 바로 접하셔도 되고, 아니면 구글에서 검색하셔도 됩니다.

 

우선 Alzheimer's disease 로 검색합니다.

 

그 중 원하는 데이터를 다운로드 받아야 합니다.

 

우선 검색하면 publication에 따라서, traits에 따라서 분류가 되어있을 것입니다. 

 

저는 Jansen IE et. al 등이 출판한 2019 Nat Genet 논문 사용할 것입니다.

 

Genome-wide meta-analysis identifies new loci and functional pathways influencing Alzheimer's disease risk.

 

GWAS Catalog

PubMed ID - First author - Journal - Publication date - View in PubMed View in Europe PMC View in PGS Catalog

www.ebi.ac.uk

 

오른쪽에 보시면 wifi 꽉 찬 아이콘이 있는데, summary statistics를 올려놓았다는 뜻입니다.

 

가장 아래 studies에 보시면, FTP download라는 것이 보이실 겁니다.

 

검색시 사용할 수 있는 study accession 번호도 있습니다.

 

FTP download를 누르시면 FTP server로 들어가집니다.

 

이중 우선 readme.txt로 끝나는 파일을 받으셔서, 

 

간단한 설명을 보시고 마음에 드는 지 확인해 보시기 바랍니다.

 

harmonized version이 있는 경우도 있는데, GWAS summary data를 hg38로 업데이트도 하고

 

좀 다듬는 작업을 하고 난 version을 올려놓습니다.

 

h version이 있다면 이거 쓰시면 됩니다.

 

 

이건 없어서 

 

AD_sumstats_Jansenetal_2019sept.txt.gz

 

를 다운로드 받습니다

 

우클릭 하셔서 주소를 복사하시고 

 

리눅스 쉘에서

 

wget http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/GCST007001-GCST008000/GCST007320/AD_sumstats_Jansenetal_2019sept.txt.gz

 

이렇게 해서 다운로드 받습니다.

 

 

이제 eQTL을 다운로드 받아야 할 차례입니다.

 

이제 GTEX portal에 들어가 봅니다

 

https://gtexportal.org/home/

 

GTEx Portal

 

gtexportal.org

 

위에 tab에 보시면 Downloads가 있습니다.

 

open access data에 들어가시면 GTEx version별로 쭉 있습니다.

 

V8이 지금 최신이라 (V9도 있긴 한데, 아직 다 만들어지지 않았습니다.)

 

V8 다운로드 받겠습니다.

 

내려가다 보면 single-tissue cis-QTL data가 있습니다.

 

거기서 우선 README file을 읽어보시기 바랍니다.

 

cis-QTL이 eQTL을 의미하고 sQTL은 splicing QTL을 의미합니다.

 

우선 GTEx_Analysis_V8_eQTL.tar 파일 역시 우클릭해서 링크 주소를 복사한 다음

 

wget으로 다운로드 받습니다

 

tar file이니 압축을 풀어줍니다.

 

 

자 이제 어느 정도 준비는 되었습니다.

 

 

 

 

 

댓글