kmeans算法基本步骤如下:
1、从数据中选择k个对象作为初始聚类中心。
2、计算每个聚类对象到聚类中心的距离来划分。
3、再次计算每个聚类中心。
4、计算标准测度函数,之道达到最大迭代次数,则停止,否则,继续操作。
K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的优化Mini Batch K-Means算法。