越来越多的研究表明,数据质量对于外显子组测序至关重要。当数据质量较低时,研究人员很可能会错过有用的变异信息。例如,埃默里大学医学院教授Madhuri Hegde在对一名视网膜营养不良患者进行外显子组测...
肿瘤组学数据分析培训班
肿瘤研究已经进入组学大数据时代,多组学技术已经广泛应用于癌症研究,尤其是用于剖析肿瘤不同生物学特点以发现生物标记物、增进对发病机制的认识、发现治疗方法等方面。但是大数据分析需要的专业统计学知识和计算机...
plotnine: python数据可视化版ggplot2
Python是一种面向对象的解释型计算机程序设计语言。Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。Python语言也有一...
NGS数据过滤之 Trimmomatic 详细说明
Trimmomatic 介绍 Trimmomatic 发表的文章至今已被引用了 2810 次,是一个广受欢迎的 Illumina 平台数据过滤工具。其他平台的数据例如 Iron torrent ,PG...
利用SPSS实现数据转换
在进行数据分析时,常需要对原始数据进行适当的转换。也许需要将连续变量转换为分类变量(比如:将年龄转换为<30岁组和≥30岁组),或者将分类变量重新编码(比如:将血型A、B、O、AB转换为A型和其...
单细胞数据降维可视化最新工具UMAP的介绍
高通量单细胞组学数据的一个显著性特点就是数据量大,一次能反映的细胞数量多。因此,通过降维和可视化去展示细胞数据特征是一个非常重要的工作。翻开各类发表的单细胞组学文章,不管是CNS的还是其他,几乎所有的...
Seurat进行单细胞RNA-seq数据整合
单细胞RNA-seq很大的特点是数据量大,数据噪声高。因此在对一些特别小的类群进行分析,或者增加数据量降噪的情况下,我们往往需要将多个单细胞RNA-seq的数据集整合起来,这些数据集可能来自不同的研究...
Kmeans聚类K值如何选,以及数据重抽样方法Bootstrapping
本文出自Bin的专栏blog.csdn.net/xbinworld。 技术交流QQ群:433250724,欢迎对算法、技术感兴趣的同学加入。我的博客写一些自己用得到东西,并分享给大家,如果有问题欢迎留...
关于RNA-Seq数据去接头(Adapter)
首先来了解一下三个概念: 1、adapter是一段短的序列已知的核酸链,用于链接序列未知的目标测序片段。 2、barcode,也称为index,是一段很短的寡居核酸链,用于在多个样品混合测序时,标记不...
Hi-C文库数据质控及解读
数据自身的质量在很大程度上决定了分析结果的准确和可靠,随着Hi-C技术在三维基因组学上的快速推广,对于Hi-C数据本身的质量和测序深度也逐渐引起研究人员的重视。同时对该技术的进一步优化和改进使之能够在...