Genomics

BRIG-原核生物比较基因组圈图展示神器

细菌基因组比较分析是时下很火热的研究方向,通过比较能够获得两个或多个基因组之间的共性及异性,在系统进化分析,物种分类鉴定,功能研究等领域中具有重要价值。 如何直观地展示基因组结构之间的相似性?BRIG...
阅读全文
Statistics

阶梯设计(the stepped-wedge design)

前几天有位大夫过来咨询,他的问题是这样的:现在有一种已经在早期研究中被证明有效的提高妇科大夫技能的某种培训,现在想在更多医院开展这样的培训,并评价其效果。 如果您也碰到这种情况,您会考虑什么样的研究设...
阅读全文
Machine Learning

KMeans中自动K值的确认方法

1  前言 聚类常用于数据探索或挖掘前期,在没有做先验经验的背景下做的探索性分析,也适用于样本量较大情况下的数据预处理等方面工作。例如针对企业整体用户特征,在未得到相关知识或经验之前先根据数据本身特点...
阅读全文
Machine Learning

聚类算法——k均值和层次聚类

看看下面这张图,有各种各样的虫子和蜗牛,你试试将它们分成不同的组别? 完成了吗?尽管这里并不一定有所谓的「正确答案」,但一般来说我们可以将这些虫子分成四组:蜘蛛、蜗牛、蝴蝶/飞蛾、蜜蜂/黄蜂。 很简单...
阅读全文
Machine Learning

聚类分析:k-means和层次聚类

尽管我个人非常不喜欢人们被划分圈子,因为这样就有了歧视、偏见、排挤和矛盾,但“物以类聚,人以群分”确实是一种客观的现实——这其中就蕴含着聚类分析的思想。 前面所提到的机器学习算法主要都是分类和回归,这...
阅读全文