RNA-Seq 데이터 분석

개요

    cDNA의 서열 분석을 수행하는 RNA-seq 기술은 진핵생물의 전사체(transcriptome)을 분석 가능하도록 하였다.
    RNA-seq은 디지털화된 유전자 발현정도를 정량화할 수 있어서 Microarray 기술을 대처할 수 있을뿐만 아니라,
    Fusion 유전자, Alternative splicing와 같은 구조적인 분석도 가능하도록 하는 분석 방법이다.

데이터 분석

  1. mRNA expression profiling
  2. Differentially expressed isoforms analysis
  3. Alternative splicing events
  4. Novel junction site discovery
  5. RNA editing site identification
  6. Fusion/new gene, rare transcripts discovery
  7. Gene-set enrichment analysis

분석 순서 및 도구

    

분석 결과 및 설명

  1. Functional Annotation
    1. 알려져 있는 gene-set을 기반으로 두 그룹간의 생물학적 특징을 나타내는 유전자 발현 패턴 분석: GSEA
    2. 생명현상의 이해에 중요한 정보를 갖고 있는 pathway를 mapping시켜주는 분석: ArraXPath
    3. 발현패턴의 클러스터 간의 상관관계 및 중요한 클러스터를 GO term주석과 함께 시각화해주는 분석: BioLattice
  2. Expression Profile Analysis
    1. 유전자의 발현 값을 바탕으로 유의한 차별 발현 유전자 선별: DESeq, edgeR
    2. 발현 값을 이용하여 샘플간의 상관관계 및 유전자의 군집 양상을 분석: R
  3. Alternative Splicing Events
    1. Exon 사용의 선택에 따른 transcriptome 재구성 결과 및 발현량: Scripture, Cufflinks
  4. Fusion/New Gene Discovery
    1. 서로 다른 유전자가 translocation, inversion 등에 의해서 하나의 유전자로 합쳐지는 fusion 유전자를 탐색: TopHat-Fusion

분석 소요시간 및 결과 조건

  1. Bioinformatics

  2. 샘플 수 (명) 데이터 분석 소요시간 가격(원) 비고
    1~8
    7 일 QC + Alignment: 2 일
    Quantification +
    Normalization : 2 일
    Basic Analysis: 3 일
    미 정 Reads: > 40 million
    Mean read length: ~130 bp
    8~16 14 일 미 정
    >100 >60 일 미 정

  3. NGS Sequencing + Bioinformatics

  4. 샘플 수 (명) 실험 수행 및 데이터 분석 소요시간 가격(원) 비고
    1
    약 2주 Sample prep. : 3 일
    Sequencing : 2 일
    QC + Alignment: 2 일
    Quantification +
    Normalization : 2 일
    Basic Analysis: 3 일
    미 정 Reads: > 40 million
    Mean read length: ~130 bp
    10 약 4주 미 정
    >100 >8 주 미 정