使用R计算相关系数的函数为: cor.test(X,Y,method="") method可以为"spearman","pearson" and "kendall",分别对应三种相关系数的计算和检验。...
芯片数据分析介绍
芯片分析概述 随着基因芯片技术的普及,基因表达数据大量产生,如何充分利用这些数据并从中提取有用的生物学知识,是生物信息学所面临的一个迫切问题。简要来说,生物芯片数据分析流程大体可分成以下几个阶段。 扫...
MCMC中的Metropolis Hastings抽样法
Metropolis Hasting(下面简称MH)是蒙特卡罗马尔科夫链中一种重要的抽样方法。本文简要介绍MH算法,并给出一个实例。 MH算法在参数空间随机取值,作为起始点。按照参数的概率分布生成随机...
R语言 KS(Kolmogorov-Smirnov)检验
Kolmogorov-Smirnov正态性检验 Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合...
NCBI RefSeq命名格式的详细说明
NCBI RefSeq (美国国立生物技术信息中心参考序列库) 是目前世界上最具有权威性的序列数据库。NCBI的参考序列计划(RefSeq)将为中心法则中自然存在的分子,从染色体到mRNA到蛋白提供参...
NCBI/DDBJ/EMBL序列的标识符:GI number和Accession.Version
GI number及Accession.Version就像是序列的身份证号码一样。通过这个号码,我们能在NCBI/DDBJ/EMBL等数据库查到该序列的数据。 问题: 为什么会有两种类型的序列标识符(...
GenBank数据库格式的说明
GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发...
测序数据分析工具大全
目前有不少用于基因组装配和比对的程序和算法,但是该选哪一个呢?许多序列分析的专家认为,这取决于基因组的大小、读取有多长,以及采用的是哪种测序技术。通常,软件还需要优化,以满足每个实验室的独特需求。在此...
二代测序数据预处理与分析
Next generation sequencing (NGS) 常使用的工具列表 质量控制Quality Control:FastQC、Fastx-toolkit 拼接Aligner:BWA,Bow...
DNA甲基化
甲基化检测服务-亚硫酸氢钠处理后测序法 (bisulfite genomic sequencing PCR, BSP)是利用未甲基化的胞嘧啶可以被亚硫酸氢钠发生脱氨基变为尿嘧啶的原理,用两一特异性引物...