首页 > 试题广场 >

以下对k-means聚类算法解释正确的是

[单选题]
以下对k-means聚类算法解释正确的是
  • 能自动识别类的个数,随即挑选初始点为中心点计算
  • 能自动识别类的个数,不是随即挑选初始点为中心点计算
  • 不能自动识别类的个数,随即挑选初始点为中心点计算
  • 不能自动识别类的个数,不是随即挑选初始点为中心点计算
这个是Clementine中K-Means算法的中心的初始化,如果按照这样理解,初始中心就不是随机,当然也不是认为指定的,而是通过某种算法确定。不过K-Means的“随即挑选”,应该是指不能认为输入的意思,所以只能随机或者按照某种策略进行选择初始中心。
发表于 2016-04-18 22:21:20 回复(2)
(1)适当选择c个类的初始中心;
(2)在第k次迭代中,对任意一个样本,求其到c个中心的距离,将该样本归到距离最短的中心所在的类;
(3)利用均值等方法更新该类的中心值;
(4)对于所有的c个聚类中心,如果利用(2)(3)的迭代法更新后,值保持不变,则迭代结束,否则继续迭代。
以上是KMeans(C均值)算法的具体步骤,可以看出需要选择类别数量,但初次选择是随机的,最终的聚类中心是不断迭代稳定以后的聚类中心。所以答案选C。
发表于 2015-08-21 10:15:38 回复(2)
1、Kmeans算法需要输入的参数是k,即为k个类。
2、然后算法随机找k个点作为初始中心:c1, c2, c3, ... ck。
3、重复一下直到收敛:
        (a)、对每个点xi:找到距离xi最近的中心cj,把这个点xi归到j类。
        (b)、对每一个类j:找到类的新中心点cj, 等于这个类的点的平均(在每个维度上),然后把这个新中心点cj在(a)步中更新。
4、当没有类更新的时候停止
发表于 2015-09-04 22:27:02 回复(0)
K-means算法是一种基于原型的聚类算法。
假设所有的样本可以划分为k个簇,需要提前指定簇的个数。
随机生成初始质心,计算各样本点到质心的距离,将其划分到各个簇中。
再计算新的质心和各样本点到新质心的距离更新所属的簇,由此迭代直至取得理想的聚类效果。
K-means算法的质心受离群点的影响容易偏离,对分簇结果干扰较大;它也不适合非球形形状的样本。
发表于 2023-01-03 18:51:36 回复(0)
哪个非监督学习能够学习到类的个数?
发表于 2016-10-23 10:17:37 回复(0)

随机选择初始质心存在的问题可以采用其他方法解决 , 比如先用层次聚类 , 或者选择离已

经选取过的初始质心最远的点 ( 通常将该方法用于点样本 ), 或者对初始化问题不太敏感的

K 均值变种 ( 二分 K 均值 ).
(见《数据挖掘导论》P315 8.2K均值)
发表于 2016-09-04 10:48:00 回复(0)