K-均值聚类法.docK-均值聚类算法
K-均值聚类算法的工作原理:
K-means 算法的工作原理:算法首先随机从数据集中选取 K 个点作为初始聚类中心, 然后计算各个样本到聚类中的距离, 把样本归到离它最近的那个聚类中心所在的类。 计算新 形成的每一个聚类的数据对象的平均值来得到新的聚类中心, 如果相邻两次的聚类中心没有 任何变化,说明样本调整结束,聚类准则函数 已经收敛。本算法的一个特点是在每次迭代 中都要考察每个样本的分类是否正确。若不正确, 就要调整, 在全部样本调整完后,再修改 聚类中心, 进入下一次迭代。如果在一次迭代算法中,所有的样本被正确分类,则不会有调 整,聚类中心也不会有任何变化,这标志着 已经收敛,因此算法结束。
K-means 聚类算法的一般步骤:
(1 ) 从 n 个数据对象任意选择 k 个对象作为初始聚类中心;
(2) 根据每个聚类对象的均值(中心对象) ,计算每个对象与这些中心对象的距离;并根 据最小距离重新对相应对象进行划分;
(3) 重新计算每个(有变化)聚类的均值(中心对象) ;
(4) 循环( 2)到( 3)直到每个聚类不再发生变化为止。
K-均值聚类法 来自淘豆网www.taodocs.com转载请标明出处.