k-means
2016-12-13 19:35:19 0 举报
K-means是一种常用的聚类算法,它通过迭代计算,将数据集划分为K个类别,使得每个数据点到其所属类别的质心距离最小化。该算法的核心思想是:首先随机选择K个数据点作为初始质心,然后将每个数据点分配到最近的质心所在的类别中,接着重新计算每个类别的质心,重复这个过程直到质心不再发生变化或达到最大迭代次数。K-means算法简单易实现,但需要提前设定K值,且对初始质心的选择敏感。此外,它假设数据集中的数据点是凸多边形分布的,因此对于非凸形状的数据集效果不佳。