Trinity学习笔记

  • A+
所属分类:Transcriptomics

1:分析流程图如下

Trinity学习笔记

2: 首先就是将样本的reads合并在一起命令如下:

3:开始拼接

输出文件:Trinity.fasta

4:拼接统计

输出文件:assembly_report.txt

5:比对reads评估表达量(每个样本都需要单独比对)

比对输出:bowtie.csorted.bam 

RSEM输出

RSEM.isoforms.results  : EM read counts per Trinity transcript

RSEM.genes.results     : EM read counts on a per-Trinity-component (aka... gene) basis, gene used loosely here.

过滤比对

过滤值需要根据需求自己设定。

6:差异表达分析(edgeR)

假定有四个样本,转录本定量输出为:

LOG.isoforms.results 

DS.isoforms.results 

HS.isoforms.results

PLAT.isoforms.results

注意:--samples_file为样本分组信息文件 group.txt ,例如:

Throat sample2.sam

Saliva sample3.sam

Throat sample4.sam

Vaginal sample5.sam

--contrasts 为样本不同条件下比较compare.txt:

Throat Saliva

Vaginal  Saliva

Throat  Vaginal

7:提取最好的OFR

输出文件:

  • Trinity.fasta.transdecoder.pep
  • Trinity.fasta.transdecoder.cds
  • Trinity.fasta.transdecoder.bed
  • Trinity.fasta.transdecoder.gff3

8:功能注释

下载的软件:Trinotate、Trinity、sqlite、NCBI Blast、HMMER、signalP v4、tmhmm v2、RNAMMER

比对数据库:SwissProt、Uniref90、Pfam domains 

标准化数据:

blast比对(比对的数据库可以换成nr/Uniref90

# search Trinity transcripts

# search Transdecoder-predicted proteins

功能域

信号肽

跨膜结构

识别rRNA

输出:Trinity.fasta.rnammer.gff

9:Load transcripts and coding regions

10:Output an Annotation Report

输出文件:trinotate_annotation_report.xls

原文来自:http://blog.sina.com.cn/s/blog_83f77c940102v7xu.html

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: