Cancer WES with Germline sequence 데이터 분석

개요

    동일한 환자로부터 암세포와 정상세포를 동시에 채취하여 분석하는 효과적인 방법이다.
    그 중에서도 암세포를 정상세포와 비교함으로 두드러지는 특성을 파악하고 그에 대한 치료방법 및 치료약의 선택이 가능하므로,
    부작용은 최소화하고 보다 정확하게 현재까지 보고된 연구 사례를 바탕으로 새로운 치료법과 약의 개발도 가능한 분석 방법이다.

데이터 분석

  1. Germline and somatic mutation comparison
  2. Somatic mutational signature identification
  3. Highly recurrent mutation/gene identification
  4. Mutual exclusivity pattern discovery
  5. Enrichment analysis of GO terms and pathways
  6. Development of therapeutic targets or biomarkers
  7. Clinical survival analysis using clinical information
  8. Cancer susceptibility gene identification

분석 순서 및 도구

    

분석 결과 및 설명

  1. Somatic and Germline Mutation Comparison
  2. Mutation Profile Analysis
    1. 변이(SNV, INDEL)에 대한 rsID, 종류(missense, nonsense, etc.), 기능(synonymous or nonsynonymous), 위치(exonic or intronic), 변이가 존재하는 유전자 주석, allele frequency: ANNOVAR
    2. 변이의 functional impact score: SIFT, PolyPhen2, CADD
    3. Read의 quality score distribution, depth coverage, alignment summary: Picard, BEDTools
  3. Loss of Function Variant/Gene Identification
    1. Nonsense 변이, splicing site에 변이, frameshift를 일으키는 indel, 첫번째 엑손을 포함한 deletion: VAT
  4. Highly Recurrent Mutation/Gene Identification
    1. 암세포에서 빈번하게 발생하는 변이를 선별하고 유전자별, 샘플별로 유의한 패턴이 있는지 mutation profile 분석: Genome MuSiC
  5. Mutual Exclusivity Pattern Discovery
    1. 상호베타적으로 발견되는 암세포 유전자를 나열하고 패턴을 분석: Dendrix
    2. 동일한 암종이라 하더라도 서로 다른 변인을 갖고 있는 암세포에서 여러 pathway에 영향을 주는 변인을 파악: Multi-Dendrix
  6. Clinical Survival Analysis
    1. 환자의 추적데이터를 바탕으로 생존에 영향(변이의 유무 등)을 주는 요인을 분석: Kaplan-Meier Survival, Cox Proportional-Hazards Regression using R

분석 소요시간 및 결과 조건

  1. Bioinformatics

  2. 샘플 수 (명) 데이터 분석 소요시간 가격(원) 비고
    1~8
    8 일 QC + Alignment: 2 일
    Variant Calling: 3 일
    Basic Analysis: 3 일
    미 정 Reads: > 40 million
    Depth coverage: ~100x
    Mean read length: ~130 bp
    8~16 14 일 미 정
    >100 >60 일 미 정

  3. NGS Sequencing + Bioinformatics

  4. 샘플 수 (명) 실험 수행 및 데이터 분석 소요시간 가격(원) 비고
    1
    약 2 주 Sample prep. : 3 일
    Sequencing : 2 일
    QC + Alignment: 2 일
    Variant Calling: 3 일
    Basic Analysis: 3 일
    미 정 Reads: > 40 million
    Depth coverage: ~100x
    Mean read length: ~130 bp
    10 약 4 주 미 정
    >100 >8 주 미 정