Reviews有效统计实践的十项简明原则 本文作者:Robert E. Kass; Brian S. Caffo; Marie Davidian; Xiao-Li Meng; Bin Yu; Nancy Reid 原文出处 Ten Simpl... 08月17日 1,693 1 阅读全文
Bioinformatics富集性分析 经常看到一些饼图,描述某些事物的组成,比如说有钱人的学历分布,然后我们可以看到高学历所占比例并不高,根据这个比例下结论通常是错的,这些比例说明不了问题,如果把各种学历在总体人口中的分布做为背景进行考虑... 01月15日 1,422 评论 阅读全文
Script超几何分布 简单点说,超几何分布就是有限样本的无放回抽样。不同于有放回抽样的二项分布(每次贝努里试验成功概率是一样的),每次的概率不相等。 随机变量X的超几何概率分布: f(k,N,M,n) = C(k,M)*C... 01月05日 3,754 1 阅读全文
ScriptR语言的各种检验 1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比如0.... 04月26日 4,405 1 阅读全文
Glossary说说大家经常见到的p值 在论坛,经常发现有人发关于P值的帖子,搜索了一下,一共有29个关于P值的帖子。的确,P值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。了解P值的由来、计算和意义很有必要。 一、P值的由来 R... 09月05日 2,146 评论 阅读全文
Bioinformatics多重假设检验中的p值校正 在生物学特别是基因组学的研究工作中,经常会遇到多重假设检验(multiple testing)的问题;此时,得到的原始p值需要进行校正后才能使用,那么哪种校正方法更加适合自己的研究工作呢?p-valu... 09月03日 11,102 2 阅读全文
Reviews关于生物实验中的统计学 最近看到一篇很有意思的博文,关于统计学在心理学中应用引发的讨论。想到平时我们生物信息学分析数据的时候,往往很多结论和推断都是基于统计学意义上进行的,看到这篇博文觉得挺有意思,与生物信息人同飨。下面是博... 09月01日 1,763 评论 阅读全文
ScriptR语言基础入门之五:简单线性回归 线性回归可能是数据分析中最为常用的工具了,如果你认为手上的数据存在着线性定量关系,不妨先画个散点图观察一下,然后用线性回归加以分析。下面简单介绍一下如何在R中进行线性回归。 一、回归建模 我们利用R语... 04月20日 25,901 评论 阅读全文
ScriptR语言基础入门之六:Logistic回归 让我们用logistic回归来结束本系列的内容吧,本文用例来自于John Maindonald所著的《Data Analysis and Graphics Using R》一书,其中所用的数据集是an... 04月04日 10,646 评论 阅读全文
ScriptR语言基础入门之三:常用统计函数运算 在R语言中经常会用到函数,例如上节中讲到的求样本统计量就需要均值函数(mean)和标准差函数(sd)。对于二元数值数据还用到协方差(cov),对于二元分类数据则可以用交叉联列表函数(table)。下文... 04月04日 2,219 评论 阅读全文