Bioinformatics线性回归的假设和pearson相关系数的假设 pearson相关系数是最经常使用的相关系数,一般情况下我们会毫不犹豫的选择它,而大部分情况下都没有考虑到数据是否符合它的假设,如下所示: 1 两个变量间有线性关系 2 变量是连续变量 3 变量均符合... 03月29日 2,091 评论 阅读全文
Bioinformatics使用R计算相关系数 使用R计算相关系数的函数为: cor.test(X,Y,method="") method可以为"spearman","pearson" and "kendall",分别对应三种相关系数的计算和检验。... 03月28日 7,285 评论 阅读全文
Evolution估计进化速率 估计进化速率的几种软件: 1 Beast 它使用MCMC的方法进行进化树的构建和一系列参数的估计,而且给出可信度区间。 它的结果比较准确,但是要得到最终的好的结果需要大量的尝试,修改各种参数使得结果最... 03月28日 2,065 评论 阅读全文
Bioinformatics原核生物转录组研究方法 在原核生物中,mRNA 只占全部 RNA 的 1-5%,其余绝大部分是 ribosomal RNA,因此若要测序 mRNA 首先必须先将 mRNA 纯化出来,然而,原核生物并不像真核生物 mRNA 具... 03月24日 3,500 3 阅读全文
Bioinformatics以RNA为测序模板的新技术:FRT-seq 目前发展成熟而被应用在许多研究的第二代测序技术中,被测序的library 大多为DNA而非RNA(测序原理请参照本部落格先前文章),在现有的mRNA-seq技术中,需先将RNA反转录为DNA,制备出D... 03月24日 1,156 评论 阅读全文
BioinformaticsStrand Specific mRNA sequencing 之重要性与分析 研究生物基因转录体的方法有许多种,而使用次代定序仪系统进行转录体定序是目前相当热门的一种方式,科学家们使用 RNA-seq 分析转录体表现主要期望能够获得三种重要信息: 1. 了解整个转录体构造、sp... 03月24日 3,835 评论 阅读全文
GlossaryQ-PCR(Real-time PCR) 实时聚合酶链锁反应(Real-time polymerase chain reaction,简称为Real-time PCR),又称定量实时聚合酶链锁反应(Quantitative real time... 03月24日 2,528 评论 阅读全文
Genomics不同长度mate-pair在组装上之差异 有时候会遇到使用者询问,为什么做不同长度的mate-pair呢? 这是因为contig间的距离不同,为了将这些不同距离的contig 组装起来,得到更完整的组装信息,所以才需要使用不同长度的mate-... 03月24日 2,923 评论 阅读全文
Genomics测序深度越深就能組出完整的genome么? 当我们在进行 de novo 测序时,一般而言,测序深度越深 (测序量越多)组装效果会越好,就如同统计学中所述,抽样的样本数越多,其分布会越接近母体之分布。 不过,是不是只要一直增加测序量就能完整组出... 03月24日 4,925 评论 阅读全文
GenomicsGC rich的区域不易测序的原因 GC rich的区域不易测序的原因,主要发生于以下两个阶段: 1. PCR 阶段 由于GC rich的区域,其氢键数较多,稳定性较强,因此在PCR时,GC rich的区域较不易分开,因此不容易被扩增。... 03月24日 1,872 评论 阅读全文