如何计算cuffdiff中的FPKM值

FPKM, 是expected number of fragments per kilobase of transcript sequence per millions base pairs sequenced缩写。直译过来就是每百万测序碱基中每千个转录子测序碱基中所包含的测序片断数。与RPKM不同的是,RPKM是直接使用的reads数,而对于FPKM,如果是pair-end的话有可能有些mapped至基因组的是一对,那就算一个片断,如果map至基因组的是只有一侧的read,也算一个片断。

FPKM的公式就可以从字面上写成:

如何计算cuffdiff中的FPKM值

其中C是map至该基因的外显子上的片断数,N是所有map至基因组的测序reads的碱基数,L就是该基因外显子碱基全长。

在其文献(Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation)Supplementary Text and Figures中是这样描述的:

如何计算cuffdiff中的FPKM值

其中beta和gamma都是likelihood function中的参数。lt被定义为

如何计算cuffdiff中的FPKM值

因为,假设transcript t的长度为l(t),那么随机分布时在某一位置t出现长度为k的片段的概率为:

如何计算cuffdiff中的FPKM值

在cuffdiff中,它会将同一组中所有的样品试为同一来源样品处理,这就是为什么同一组内如果有三个样品的话,最终得到FPKM值并不是三个样品单独运算得到的FPKM值的平均值。

  • 文章来源: 未知。文章来源待更新,请等待。
  • 版权说明: 除非特殊说明,本站文章版权归于文章来源网站或投稿作者。未标记来源文章,请原作者联系管理员更新版权信息

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:1   其中:访客  0   博主  0   引用   1

    来自外部的引用: 1

    • 统计BAM文件中的reads数 | Public Library of Bioinformatics