2023-06-17 11:30 知乎_产品

关注

Day49：常用聚类算法详解与实例

alt

在上一节中，我们介绍了决策树的原理和实现。接下来，我们将进入聚类算法的领域，这是一种无监督学习方式。聚类算法用于将数据集中的样本划分为不同的组，使得同一组内的样本相似度较高，不同组之间的样本相似度较低，这类算法是从数据特征中学习知识，不需要标签进行指导。我们主要介绍三种常用的聚类算法。

1. K-means聚类算法：

算法原理：K-means聚类算法是一种基于距离的聚类算法。它将样本划分为K个簇，每个簇由一个中心点表示。算法通过迭代优化的方式，使得每个样本到所属簇的中心点距离最小。具体步骤如下：
1. 随机初始化K个聚类中心点。
2. 将每个样本分配到距离最近的聚类中心点所属的簇。
3. 更新每个簇的中心点为该簇所有样本的均值。
4. 重复步骤2和步骤3，直到聚类中心点不再发生变化或达到最大迭代次数。
优点：简单、高效，适用于大规模数据集；易于解释和理解。
缺点：对初始聚类中心的选择敏感；对噪声和异常值敏感；无法处理非球形簇或大小差异较大的簇。
适用条件：适用于簇具有凸性和相似大小的数据集。

from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

# 创建K-means聚类器对象
kmeans = KMeans(n_clusters=3, random_state=42)

# 使用训练数据进行聚类
kmeans.fit(X_train)

# 获取聚类结果
labels = kmeans.labels_

# 绘制聚类结果图
plt.scatter(X_train[:, 0], X_train[:, 1], c=labels)
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], marker='x', color='r')
plt.show()

1alt

2. 层次聚类算法（Hierarchical Clustering）：

算法原理：层次聚类算法通过逐步合并或分割样本来构建聚类树（树状的聚类结构），从而形成层次化的聚类结果。具体步骤如下：
1. 将每个样本视为一个初始簇。
2. 计算簇与簇之间的相似度（如欧氏距离或相关系数）。
3. 选择相似度

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

大模型-AI小册文章被收录于专栏

1. AI爱好者，爱搞事的 2. 想要掌握第二门语言的Javaer或者golanger 3. 决定考计算机领域研究生，给实验室搬砖的uu，强烈建议你花时间学完这个，后续搬砖比较猛 4. 任何对编程感兴趣的，且愿意掌握一门技能的人

全部评论

推荐最新楼层

牛客489853314号

好像看出来了区别

点赞回复分享

发布于 2023-07-14 15:33 上海

09-28 15:53

门头沟学院 golang

美团面试全过，offer却没了面了一个半月，从一面、二面、三面、加面到HR面一路过关斩将，自我感觉不错，结果最后谈薪被横向了，官网流程已结束。。。

Yki_：希望这是你秋招路上最后一次坏运气，加油向前看

我的秋招日记

点赞评论收藏

分享

09-27 12:34

门头沟学院 Java

吐槽一下昨天面的弱智公司

桥介数物（深圳）科技有限公司我根本没投过这个公司，结果直接给我发邮件，约线上面试。我就想着正好面一下吧，练练八股。等到正式面试，一打开摄像头，我就感觉不对了。两个面试官不说，看着比我还年轻。。。我心想这是公司没人了，找俩实习生来给我面试了。再者我几把根本不知道面的什么岗位，上来让我做两道题。让我先打开ide，看见copolit让我关掉copolit插件，然后又问我为啥还有大段代码补全，我怎么知道？ide智能关我啥事，又让我用记事本写。双栈模拟队列，随便写了写，说我写的有问题，又开始问我基础知识。问数据结构，让我讲二叉树的前中后序遍历，讲循环队列。。这跟几把我简历关系大吗？又让我讲讲开源项目，又...

烟梦s：我之前找实习面试小公司也是让我关了代码补全

这个还是很正常的吧

查看2道真题和解析

点赞评论收藏

分享

08-25 14:48

已编辑

百度时代网络技术（北京）有限公司_搜索策略部_AI搜索大模型算法工程师(实习员工)

一天半速通，百度offer！

搜索部 首先说下timeline8.18，投递8.19，约一面8.21，晚上一面call约二面8.22，上午二面下午oc周末等待（8.23，8.24）8.25，offer一年前，我还是懵懵懂懂，高考完的暑假，只会提前学学高数，未来的画像是什么？我或许无法预测。开学后，自学Python，接单，无数个客户的ddl，偷偷摸摸一个人找自习的地方，这一步步竟然为后来的我，搭建工程能力的基础。大一上，我也要感谢我的第一位老板，让我接触到了实习，师兄带着我一步步入门，看他们写的飞书文档。大一下，导师带我参与企业项目，这让我渐渐发现，应该去实践，增长见识，而非局限当下，盯着自己的小新pro。不久后，第一波投递开始，结果当然是约面极少。盯着简历上的文字和ssob，我开始思考，确实很多可以去提升。带着些许不甘心，继续沉淀，慢慢的约面也越来越多，有的时候两天7场，准备完就接着下一个日程。这一次，也许是刚好到位吧，比较match，面试答的流利，关关难关关过，成为度孝子展望未来，依然是重重挑战，果然只有收到offer的那一刻是开心的。愿在百度星海拆解的每一段代码，都能成为丈量宇宙的诗行；此志终赴星河，而今迈步重铸天阶。屏幕前的你们，在无数个向星海奔赴的日夜，一定一定，会在未来化作群星回响的征程——请永远相信此刻埋首耕耘的自己！！！

一天三顿半：？？？百度提前批发 offer了？不是统一和正式批排序完再发吗我靠

百度求职进展汇总

点赞评论收藏

分享

09-12 15:51

南京技师学院大堂经理

字节一年人间三年

身边去字节的朋友没有一个不说字节累的我的hxd秋招offer打牌，拿了蚂蚁转正，最后还是去了字节基本每天十点半样子下班现在经常懊悔当初就应该留在蚂蚁躺平

码农索隆：主要钱也多啊，我钱不多啊

投递蚂蚁集团等公司10个岗位

点赞评论收藏

分享

09-24 15:58

门头沟学院自动化

上海15w要去吗

目前只收到了一个上海的Offer，但是薪资只有15w（各种福利都加上之后的），要不要去，没有其他的offer。目前唯一担心的事情，就是害怕不好定居，不想生活质量太差，我感觉跳槽不太容易，不像互联网大厂这行业能找的工作，基本上就是国企，私企条件很差，另外就是买房的问题，是不是这个薪资在上海一辈子买不到房啊（家里人很难给我很大的支持）各位推荐去吗，还是试试放弃之后试试小城市啊

ldf李鑫：如果在上海找15w的话在别的小城市会更低

我的秋招日记

点赞评论收藏

分享

评论

1

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI创作大赛：牛可乐的国庆之旅 #

5654次浏览 82人参与

# 摸鱼打卡站 #

57858次浏览 747人参与

# 乐堡互娱校招 #

41662次浏览 334人参与

# 牛友的国庆旅行碎片 #

1801次浏览 8人参与

# 距离放假还有_天，我已经…… #

7380次浏览 49人参与

# 国庆放假，你还会投简历吗？ #

2702次浏览 25人参与

# 携程求职进展汇总 #

629550次浏览 4630人参与

# 你秋招想去哪些公司 #

60564次浏览 1687人参与

# 技术转行的心路历程 #

63664次浏览 703人参与

# 今年秋招还有金九银十吗 #

5969次浏览 43人参与

# 应届生第一份工作最好去大厂吗？ #

38133次浏览 618人参与

# 秋招感动瞬间 #

40184次浏览 344人参与

# 国庆放假，你还会主动学习吗？ #

2427次浏览 27人参与

# 25届网易互娱暑实进度 #

86154次浏览 737人参与

# 滴滴求职进展汇总 #

259948次浏览 2283人参与

# 4399求职进展汇总 #

35559次浏览 208人参与

# 阿里云工作体验 #

27436次浏览 100人参与

# 非技术岗是怎么找实习的 #

251125次浏览 2515人参与

# 哪些公司真双非友好？ #

31820次浏览 152人参与

# 滴滴工作体验 #

30234次浏览 137人参与

# 大厂面试初体验 #

58492次浏览 287人参与

# 工作后会跟朋友渐行渐远吗 #

43459次浏览 330人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务