Bioinformatics

如何处理批次效应(batch effect)

在生信分析过程中,尤其是转录组分析中,经常会遇到测得数据不足,需要利用公共数据库中已有的数据,那么能将这些数据直接和测序的数据混合吗?如果贸然混合,会有什么问题? 10年nature有一篇综述,专门讲...
阅读全文
Machine Learning

确定最佳聚类数目的10种方法

在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过,看了很多博客,大多泛泛带过。今天把看到的这么多方...
阅读全文
Script

R中坐标轴截断的不同实现方式

本文在做学术论文中,正好想做一下把y轴一些数据进行截断的效果。通过网上检索,整理了一下两种方式构建坐标轴截断图。 plotrix包 利用gap.barplot()进进行绘制,将gap参数设置为90,4...
阅读全文
Script

基于R语言绘制坐标轴截断图

画图时经常遇到不同组的数据大小相差很大,大数据就会掩盖小数据的变化规律,这时候可以对Y轴进行截断,从而可以在不同层面(大数据和小数据层面)全面反映数据变化情况,如下图所示。 搜索截断图绘制的方法,有根...
阅读全文