t-SNE使用过程中的一些坑 Machine Learning

t-SNE使用过程中的一些坑

几年前,我写过一个关于t-SNE原理的介绍博客,在日常的工作中,涉及到数据可视化的时候一般都会想到去使用这个工具。但是使用归使用,大部分人却很少去思考为什么要用t-SNE,怎样“正确”的使用t-SNE...
阅读全文
确定最佳聚类数目的10种方法 Machine Learning

确定最佳聚类数目的10种方法

在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过,看了很多博客,大多泛泛带过。今天把看到的这么多方...
阅读全文
K-Means聚类算法详解 Machine Learning

K-Means聚类算法详解

前言 K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优...
阅读全文
常用的模型评估指标 Machine Learning

常用的模型评估指标

“没有测量,就没有科学。”这是科学家门捷列夫的名言。 在计算机科学中,特别是在机器学习的领域,对模型的测量和评估同样至关重要。只有选择与问题相匹配的评估方法,我们才能够快速的发现在模型选择和训练过程中...
阅读全文
六大聚类算法快速了解 Machine Learning

六大聚类算法快速了解

在机器学习中,无监督学习一直是我们追求的方向,而其中的聚类算法更是发现隐藏数据结构与知识的有效手段。目前如谷歌新闻等很多应用都将聚类算法作为主要的实现手段,它们能利用大量的未标注数据构建强大的主题聚类...
阅读全文
KMeans中自动K值的确认方法 Machine Learning

KMeans中自动K值的确认方法

1  前言 聚类常用于数据探索或挖掘前期,在没有做先验经验的背景下做的探索性分析,也适用于样本量较大情况下的数据预处理等方面工作。例如针对企业整体用户特征,在未得到相关知识或经验之前先根据数据本身特点...
阅读全文