机器学习 - 基于质心的聚类
基于质心的聚类是一类机器学习算法,旨在根据数据点与每个聚类质心的接近程度,将数据集分区为组或聚类。
聚类的质心是该聚类中所有数据点的算术平均值,并作为该聚类的代表点。
两种最流行的基于质心的聚类算法是 −
K-means 聚类
K-means 聚类是一种流行的无监督机器学习算法,用于对数据进行聚类。它是一种简单高效的算法,可以根据数据点的相似性将它们分组为 K 个聚类。该算法首先随机选择 K 个质心作为每个聚类的初始中心。然后,将每个数据点分配到距离其最近的聚类的质心。接着,通过取聚类中所有数据点的均值来更新质心。此过程重复进行,直到质心不再移动或达到最大迭代次数为止。
K-medoids 聚类
K-medoids 聚类是一种基于分区的聚类算法,用于将一组数据点聚类为 “k” 个聚类。与使用数据点均值作为聚类中心的 K-means 聚类不同,K-medoids 聚类使用一个代表性数据点(称为 medoid)来表示聚类中心。medoid 是使它与聚类中所有其他数据点距离之和最小化的数据点。这使得 K-medoids 聚类比 K-means 聚类对异常值和噪声更鲁棒。
我们将在接下来的两章中讨论这两种聚类方法。