본문 바로가기

전체 글11

KoGES imputation (2) - QC 및 filtering #1 Imputation은 아래 내용 참조하여 시행하셨을 겁니다. https://nephro.tistory.com/11 KoGES imputation (1)한국인 유전체 역학조사사업 (KoGES) genotype data를 imputation하는 과정입니다. KoGES는 KARE (안산안성), CAVAS, HEXA cohort로 구성되어 있습니다. 가장 처음 genotype 된 KARE는 8840명이고, 이것은 1000 G로 imputationephro.tistory.com  이제 imputed 라는 디렉토리 안에 imputation 된 파일들이 존재할 것입니다. 예를 들어 log 파일 하나를 보도록 하겠습니다. 저는 root ID로 작업을 하도록 bash file을 만들었는데, nas에서 작업이 이루어지기 .. 2024. 8. 26.
Single cell best-practice (1) - 6. Quality Control (Part I) 0. Introduction Single cell best-practice 분석 환경은 R을 기반으로 하는 bioconductor (OSCA)와 seurat, 그리고 파이썬을 기반으로 하는 scanpy가 있습니다. 이 scanpy는 scverse라고 하는 ecosystem의 일부입니다. 이것에 대해 잘 설명하는 best-practice가 있습니다. scanpy를 만든 thesis lab에서 올린 것 같습니다. https://www.sc-best-practices.org/preamble.html Single-cell best practices — Single-cell best practices www.sc-best-practices.org 여기에 single cell 분석에 대하여 아주 자세히, 그리고 잘.. 2024. 7. 15.
KoGES imputation (1) 한국인 유전체 역학조사사업 (KoGES) genotype data를 imputation하는 과정입니다. KoGES는 KARE (안산안성), CAVAS, HEXA cohort로 구성되어 있습니다. 가장 처음 genotype 된 KARE는 8840명이고, 이것은 1000 G로 imputation된 데이터를 같이 줍니다. (정확히는 같이 신청할 수 있습니다) 그리고 KCHIP ver 1.0으로 만들어진 7만여명의 데이터는 5000여명의 KARE, 그리고 HEXA 5만여명, CAVAS 만여명으로 구성되어 있습니다. 처음에 받으면 map, ped 파일로 되어있습니다. 그런데 1000 genome으로 imputation 된 데이터 imputation이 굉장히 오래되어서 좀 이상한 부분이 많고 KCHIP은 imput.. 2023. 11. 17.
clusterProfiler를 이용한 pathway enrichment analysis (GSEA) bulk RNA seq 분석 후 얻어진 정보 등을 이용하여 pathway analysis 중 하나인 gene set enrichment anaylysis를 해보려고 합니다. pathway enrichment analysis라고도 하고, pathway analysis라고도 하고, gene set enrichment analysis라고도 하고... 여러 이름으로 불리는데, 결국 target으로 하는 gene set이 curation되어있는 pathway에 얼마나 해당되어 있는지를 보는 분석입니다 크게 3가지가 있고 (1) over-representation test 어떤 pathway가 55가지의 gene으로 구성되었을 때, 내가 찾은 gene set이 몇개 속해 있느냐 (2) functional class.. 2023. 10. 20.