首页 > 试题广场 >

以下对k-means聚类算法解释正确的是

[单选题]

能自动识别类的个数,随即挑选初始点为中心点计算

能自动识别类的个数,不是随即挑选初始点为中心点计算

不能自动识别类的个数,随即挑选初始点为中心点计算

不能自动识别类的个数,不是随即挑选初始点为中心点计算

查看答案及解析

灵印

这个是Clementine中K-Means算法的中心的初始化，如果按照这样理解，初始中心就不是随机，当然也不是认为指定的，而是通过某种算法确定。不过K-Means的“随即挑选”，应该是指不能认为输入的意思，所以只能随机或者按照某种策略进行选择初始中心。

发表于 2016-04-18 22:21:20 回复(2)

在午休的里根很高大

（1）适当选择c个类的初始中心；

（2）在第k次迭代中，对任意一个样本，求其到c个中心的距离，将该样本归到距离最短的中心所在的类；

（3）利用均值等方法更新该类的中心值；

（4）对于所有的c个聚类中心，如果利用（2）（3）的迭代法更新后，值保持不变，则迭代结束，否则继续迭代。
以上是KMeans（C均值）算法的具体步骤，可以看出需要选择类别数量，但初次选择是随机的，最终的聚类中心是不断迭代稳定以后的聚类中心。所以答案选C。

发表于 2015-08-21 10:15:38 回复(2)

zhangxiangjor

1、Kmeans算法需要输入的参数是k，即为k个类。

2、然后算法随机找k个点作为初始中心：c1, c2, c3, ... ck。

3、重复一下直到收敛：

(a)、对每个点xi：找到距离xi最近的中心cj，把这个点xi归到j类。

(b)、对每一个类j：找到类的新中心点cj, 等于这个类的点的平均（在每个维度上），然后把这个新中心点cj在(a)步中更新。

4、当没有类更新的时候停止

发表于 2015-09-04 22:27:02 回复(0)

fishroll

K-means算法是一种基于原型的聚类算法。

假设所有的样本可以划分为k个簇，需要提前指定簇的个数。

随机生成初始质心，计算各样本点到质心的距离，将其划分到各个簇中。

再计算新的质心和各样本点到新质心的距离更新所属的簇，由此迭代直至取得理想的聚类效果。

K-means算法的质心受离群点的影响容易偏离，对分簇结果干扰较大；它也不适合非球形形状的样本。

发表于 2023-01-03 18:51:36 回复(0)

ProJay

哪个非监督学习能够学习到类的个数？

发表于 2016-10-23 10:17:37 回复(0)

伊利殺白

随机选择初始质心存在的问题可以采用其他方法解决 , 比如先用层次聚类 , 或者选择离已

经选取过的初始质心最远的点 ( 通常将该方法用于点样本 ), 或者对初始化问题不太敏感的

K 均值变种 ( 二分 K 均值 ).

（见《数据挖掘导论》P315 8.2K均值）

发表于 2016-09-04 10:48:00 回复(0)

提交观点

问题信息

数理统计自然语言处理

来自：2025年春招-中国电...

上传者：小小

难度：

6条回答 444收藏 23540浏览