Glossary

高通量测序领域常用名词解释

什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定...
阅读全文
Glossary

两列样本的差异基因筛选

两列样本数据的差异基因筛选方法:FoldChange法+FDR控制 其中,FDR值的计算方法如下: 1)对每个基因进行p-value的计算 假设观测到基因A对应的reads数为x,已知在一个大文库中,...
阅读全文
Glossary

外显子组测序

外显子(exon)是真核生物基因的一部分,包含着合成蛋白质所需要的信息。全部外显子,称为“外显子组”(Exome)。外显子组测序(Exome sequencing)是指利用序列捕获技术将全基因组外显子...
阅读全文
Glossary

何为假设性检验?

准备再尝试一下,用大白话叙述一遍统计推断中最基础的东西(假设检验、P值、……),算是把这段时间的阅读和思考做个梳理(东西不难,思考侧重在如何表述和展示)。这次打算用一种“迂回的”表达方式,比如,本文从...
阅读全文
Glossary

P-value:一个注脚

在上一篇文章里面简要介绍了p值的由来、计算和意义,这篇文章刚再次谈谈p-value。 P值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率。 The P-value is the pr...
阅读全文
Glossary

说说大家经常见到的p值

在论坛,经常发现有人发关于P值的帖子,搜索了一下,一共有29个关于P值的帖子。的确,P值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。了解P值的由来、计算和意义很有必要。 一、P值的由来 R...
阅读全文
Glossary

箱线图(boxplot)介绍

箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法。它也可以粗略地看出数据是否具有...
阅读全文
Glossary

SAM格式

SAM是一种序列比对格式标准, 由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。 不同的软件,不同的时期,不同...
阅读全文
Glossary

内含子有什么用?

作者:牛登科 三十年前问这个问题?你得到的答复是内含子没什么用,属于垃圾DNA或者说分子水平的寄生虫。 但是后来,一个又一个基因的可变剪接现象被发现。尤其是人类基因组测序完成后,人类基因组中没有发现原...
阅读全文