富集性分析 Bioinformatics

富集性分析

经常看到一些饼图,描述某些事物的组成,比如说有钱人的学历分布,然后我们可以看到高学历所占比例并不高,根据这个比例下结论通常是错的,这些比例说明不了问题,如果把各种学历在总体人口中的分布做为背景进行考虑...
阅读全文
超几何分布 Script

超几何分布

简单点说,超几何分布就是有限样本的无放回抽样。不同于有放回抽样的二项分布(每次贝努里试验成功概率是一样的),每次的概率不相等。 随机变量X的超几何概率分布: f(k,N,M,n) = C(k,M)*C...
阅读全文
R语言的各种检验 Script

R语言的各种检验

1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验)      检验数据是否符合正态分布,R函数:shapiro.test().  结果含义:当p值小于某个显著性水平α(比如0....
阅读全文
说说大家经常见到的p值 Glossary

说说大家经常见到的p值

P值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。了解p值的由来、计算和意义很有必要。 一、P值的由来 R·A·Fisher(1890-1962)作为一代假设检验理论的创立者,在假设检验中首...
阅读全文
多重假设检验中的p值校正 Bioinformatics

多重假设检验中的p值校正

在生物学特别是基因组学的研究工作中,经常会遇到多重假设检验(multiple testing)的问题;此时,得到的原始p值需要进行校正后才能使用,那么哪种校正方法更加适合自己的研究工作呢?p-valu...
阅读全文
关于生物实验中的统计学 Reviews

关于生物实验中的统计学

最近看到一篇很有意思的博文,关于统计学在心理学中应用引发的讨论。想到平时我们生物信息学分析数据的时候,往往很多结论和推断都是基于统计学意义上进行的,看到这篇博文觉得挺有意思,与生物信息人同飨。下面是博...
阅读全文
R语言基础入门之五:简单线性回归 Script

R语言基础入门之五:简单线性回归

线性回归可能是数据分析中最为常用的工具了,如果你认为手上的数据存在着线性定量关系,不妨先画个散点图观察一下,然后用线性回归加以分析。下面简单介绍一下如何在R中进行线性回归。 一、回归建模 我们利用R语...
阅读全文