首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
什么是信息熵、信息增益和信息增益比?它们在机器学习中有什么作
[问答题]
什么是信息熵、信息增益和信息增益比?它们在机器学习中有什么作用?
查看答案及解析
添加笔记
求解答(0)
邀请回答
收藏(2)
分享
纠错
1个回答
添加回答
0
牛客631410044号
基尼指数是衡量数据集不纯度或分类不平衡程度的指标,常用于决策树的特征分裂(如CART算法)。其核心思想是:从数据集中随机抽取两个样本,它们属于不同类别的概率越低,数据集的纯度越高。 1. 计算公式 对于数据集 D 包含 K 个类别,基尼指数定义为: Gini(D)=1−k=1∑Kpk2 其中 pk 是第 k 个类别在数据集 D 中的占比。 示例: 假设一个数据集有 10 个样本,其中 6 个属于类别 A,4 个属于类别 B: Gini(D)=1−((106)2+(104)2)=1−(0.36+0.16)=0.48 2. 特征分裂时的基尼增益 选择特征分裂时,计算分裂后的加权基尼指数,基尼增益(Gini Gain)越大,分裂效果越好: Gini Gain=Gini(D)−v=1∑V∣D∣∣Dv∣Gini(Dv) Dv:按特征某个值划分后的子数据集。 V:特征的可能取值数。 示例: 用特征“年龄”分裂数据集,得到两个子集 D1(年轻)和 D2(年长): 若 Gini(D1)=0.2,Gini(D2)=0.3,且 ∣D1∣/∣D∣=0.6,∣D2∣/∣D∣=0.4: [ \text{Gini Gain} = 0.48 - (0.6 \times 0.2 + 0.4 \times 0.3) = 0.48 - 0.24 = 0.24 ]
发表于 2025-08-29 21:56:29
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
来自:
机器学习-牛客面经八股
难度:
1条回答
2收藏
112浏览
热门推荐
相关试题
什么是precision(精确率)...
评论
(2)
来自
机器学习-牛客面经八股
数据分析常用的方法有哪些?各自适合...
评论
(1)
来自
机器学习-牛客面经八股
过拟合常见的解决方法有哪些?各自的...
评论
(1)
来自
机器学习-牛客面经八股
什么是AUC?AUC的计算公式和原...
评论
(0)
来自
机器学习-牛客面经八股
常见的聚类算法有哪些?如何评价聚类效果?
评论
(0)
来自
机器学习-牛客面经八股
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题