二代测序数据预处理与分析

评论8,732

Next generation sequencing (NGS)

二代测序数据预处理与分析-图片1

常使用的工具列表

  • 质量控制Quality Control:FastQC、Fastx-toolkit
  • 拼接Aligner:BWA,Bowtie, Tophat, SOAP2
  • Mapper:Tophat, Cufflinks
  • 基因定量 Gene Quantification: Cufflinks, Avadis NGS
  • 质量改进 Quality improvement: Genome Analysis Toolkit(GATK)
  • SNP: Unified Genotyper,Glfmultiple, SAMtools, Avadis NGS
  • CNV: CNVnator
  • Indel: Pindel, Dindel, Unified Genotyper, Avadis NGS
  • Mapping to a gene: Cufflinks, Rsamtools, Genomic Features

相关的数据格式

  • FASTQ:
  • SAM: A generic nucleotide alignment format
  • BAM: binary format
  • VCF

数据处理的流程

二代测序数据预处理与分析-图片2

RNAseq数据不容易分析的原因:

  • 差异大,0~几万
  • 基因多
  • 巨大的变异
  • 样本量小

鉴定SNP可供借鉴的经验

如果一个基因中SNP数目超过3个,10个碱基中SNP数目超过2个,这样的SNP就需要怀疑;

通过RNAseq、DNAseq鉴定SNP,有什么区别?

本质没有区别,但是RNAseq时,需要注意可变剪接造成的SNP。
原文来自:博耘生物 http://boyun.sh.cn/bio/?p=1862

 

发表评论

匿名网友