t-SNE | Public Library of Bioinformatics

数据降维与可视化之t-SNE

t-SNE是目前来说效果最好的数据降维与可视化方法，但是它的缺点也很明显，比如：占内存大，运行时间长。但是，当我们想要对高维数据进行分类，又不清楚这个数据集有没有很好的可分性（即同类之间间隔小，异类之...

01/125,974评论

几年前，我写过一个关于t-SNE原理的介绍博客，在日常的工作中，涉及到数据可视化的时候一般都会想到去使用这个工具。但是使用归使用，大部分人却很少去思考为什么要用t-SNE，怎样“正确”的使用t-SNE...

01/124,380评论

高通量单细胞组学数据的一个显著性特点就是数据量大，一次能反映的细胞数量多。因此，通过降维和可视化去展示细胞数据特征是一个非常重要的工作。翻开各类发表的单细胞组学文章，不管是CNS的还是其他，几乎所有的...

04/2419,986评论

大数据文摘作品编译：寒小阳、蒋宝尚、Sheila、赖小娟、钱天培假设你有一个包含数百个特征（变量）的数据集，却对数据所属的领域几乎没有什么了解。你需要去识别数据中的隐藏模式，探索和分析数据集。不...

03/0610,027评论

t-SNE(t-distributed stochastic neighbor embedding)是用于降维的一种机器学习算法，是由 Laurens van der Maaten 和 Geoffre...

01/1212,4681