首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
拖拉机的拖拉
University of Saskatchewan 算法工程师
关注
已关注
取消关注
m
@林小白zii:
机器学习面经-评估方法与评价指标
一、简介 在机器学习中,评价方法和评价指标用于衡量模型在给定数据上的性能和预测能力。不同的任务和问题可能会选择不同的评价方法和评价指标。如准确率、召回率、均方误差、AUC等。 二、面经 1、请问模型常用的评估方法有哪些? 2、请问常用的评价指标有哪些? 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 4、讲讲F1-score是怎么算的? 5、针对上面提到的一些指标,当训练集中类别不均衡,哪个最不准确? 6、ROC、AUC、PR曲线是什么关系? 7、AUC为什么比其他指标好? 8、AUC高是否一定说明auc高的模型排序能力更强?AUC对均匀正负样本采样不敏感? 9、AUC 值本身的理论上限是1吗? 10、AUC 与线上业务指标的宏观关系? 11、ROC曲线和PR曲线的区别?各自的适用场景? 三、面经参考回答 1、请问模型常用的评估方法有哪些? 参考回答:常用的评估方法包括以下几种: 训练集和测试集划分:将数据集划分为训练集和测试集,通常按照一定比例(如70%训练集,30%测试集)划分数据。训练集用于训练模型,测试集用于评估模型的性能和泛化能力。 交叉验证:K折交叉验证:将数据集划分为K个子集,依次选取其中一个子集作为验证集,剩余K-1个子集作为训练集,进行K次训练和测试,最后将K次评估结果取平均值。K折交叉验证可以更充分地利用数据集,得到更稳定的性能评估结果。留一交叉验证:特殊情况下,K折交叉验证中K等于数据集大小,即每次只留一个样本作为验证集。 自助法(Bootstrap):自助法是一种有放回的采样方法,从原始数据集中随机采样得到一个新的训练集,然后使用剩余样本作为测试集。由于自助法采样可能会产生多个相似的数据集,因此可以得到多个模型性能评估结果,通过取平均值来得到最终评估结果。 留出集法(Hold-out):将数据集划分为训练集、验证集和测试集三部分。训练集用于模型训练,验证集用于调参和模型选择,测试集用于评估模型在未知数据上的泛化能力。 时间序列交叉验证:对于时间序列数据,为了避免训练集包含未来的信息,常用的交叉验证方法有滚动交叉验证和时间序列分割交叉验证。 2、请问常用的评价指标有哪些? 参考回答:当评估机器学习模型的性能时,常用的评价指标根据任务类型可以分为以下几类: 分类任务评价指标: 准确率(Accuracy):分类正确的样本数占总样本数的比例。 精确度(Precision):真阳性样本数占所有被模型预测为正样本的样本数的比例。 召回率(Recall):真阳性样本数占所有真实正样本的样本数的比例。 F1分数(F1 Score):精确度和召回率的调和平均,用于综合考虑模型的准确性和召回性能。 ROC曲线和AUC:ROC曲线绘制了灵敏度(召回率)和特异度之间的关系,AUC用于度量ROC曲线的性能,越接近1表示模型性能越好。 回归任务评价指标: 均方误差(Mean Squared Error,MSE):预测值与真实值之间的平方差的均值。 平均绝对误差(Mean Absolute Error,MAE):预测值与真实值之间的绝对值差的均值。 R2分数(R-squared):模型预测值的方差占总方差的比例,越接近1表示模型拟合效果越好。 聚类任务评价指标: 轮廓系数(Silhouette Coefficient):衡量聚类的紧密性和分离性,越接近1表示聚类效果越好。 互信息(Mutual Information):衡量聚类结果与真实标签之间的信息量,越大表示聚类效果越好。 排序任务评价指标: 平均精确率(Mean Average Precision,MAP):对多个查询的平均精确率的平均值。 多标签分类任务评价指标: Hamming Loss:平均每个样本上错误的标签比例。 Jaccard Similarity Score:真实标签和预测标签的交集与并集之间的比例。 不同的评价指标适用于不同的任务和场景,根据具体的问题选择合适的评价指标是非常重要的。在实际应用中,通常需要综合考虑多个评价指标,并根据业务需求来选择最适合的评价指标。 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 参考回答:先说一下含义:TP、FP、FN、TN分别为真阳性、假阳性和假阴性、真阴性。简单来说,就是: 真阳性(TP):标签为正类,预测为正类; 假阳性(FP):标签为负类,预测为正类; 真阴性(TN):标签为负类,预测为负类; 假阴性(FN):标签为正类,预测为负类; 准确率(Accuracy):T
点赞 5
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
04-07 15:05
南京信息工程大学 Java
腾讯PCG二面
7、你们redis用的是哪里的集群版8、Redis 主备机制是怎么实现的呢?9、Redis 选主机制10、Pulsar 有哪些集群的实现版本?11、Redis 的 ZSet 详细说说,再说说插入、查找的过程15、CAP 理论说一说,然后什么场景、中间件用什么?16、OpenClaw (OpenHands/Agent) 的底层实现机制17、Agent 的 Memory 机制有了解吗?18、Redis 慢查询怎么排查?19、MySQL 一致性的实现是怎么做的呢?20、MySQL 是怎么保证数据不丢,怎么保证数据不错的呢?21、Undo Log, Binlog, Redo Log 的作用22、事务的...
查看15道真题和解析
点赞
评论
收藏
分享
03-12 15:40
门头沟学院 运营
刚加上这个hr,结果是个广子,发完第一句话就被封号了微信
站队站对牛:
都是疯狂搞玩笑的
点赞
评论
收藏
分享
02-28 14:56
北京交通大学 Java
27届无实习想进大厂暑期
目前进度是codetop前五页+hot100刷完了,八股背完了一轮但是感觉没背熟,求大佬们拷打简历
肖先生~:
八股文,我觉得最好是在面试中学习成长倒逼提升自己的能力
没有实习经历,还有机会进...
点赞
评论
收藏
分享
04-06 22:50
华勤技术_远图未来_bios开发工程师(实习员工)
Bios实习 学习篇- 2.DXE阶段核心功能详解
DXE 是 UEFI 启动流程中最核心、最复杂的阶段。它从 PEI 交接来的 HOB 列表出发,建立完整的 UEFI 系统服务环境,发现并调度 DXE 驱动,构建 Handle/Protocol 为中心的协议数据库,并逐步把平台组织成一个可被 BDS 使用、可供 OS Loader 接管的标准预启动环境。1. DXE 的起点:接收 HOB,接管系统状态PEI 通过 DXE IPL PPI 把 HOB List 传给 DXE Foundation。HOB 中记录了启动模式、已初始化内存、固件设备、Firmware Volume、I/O 与 MMIO 等关键信息,DXE 以此为依据建立后续的内存服...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
我感觉我遇到神仙mentor了
1.1W
2
...
秋招失利别慌,好offer不怕晚
6091
3
...
谁都可能在说谎,但财报不会骗人
5904
4
...
入职翼支付2年多,聊聊感受
5234
5
...
我在北京的2046天
4085
6
...
上线一个月了,说几句真心话
3764
7
...
淘天aiagent一面
3280
8
...
字节一二三hr面 java面经(已off)
3235
9
...
有了这个skill我再也没手动改过简历
2939
10
...
招行给AI时代数字金融人的答案
2342
创作者周榜
更多
正在热议
更多
#
Agent面试会问什么?
#
32447次浏览
1287人参与
#
米哈游工作体验
#
29651次浏览
143人参与
#
厦门银行科技岗值不值得投
#
18666次浏览
421人参与
#
面试体验最好和最差的公司
#
23195次浏览
161人参与
#
携程笔试
#
152492次浏览
885人参与
#
我的求职进度条
#
979967次浏览
6523人参与
#
哪些公司一直卡在简历筛选
#
104055次浏览
343人参与
#
一人分享一个skill
#
8463次浏览
226人参与
#
选实习,你更看重哪方面?
#
76440次浏览
505人参与
#
春招至今,你收到几个面试了?
#
82890次浏览
1080人参与
#
拼多多工作体验
#
55176次浏览
389人参与
#
说说你知道的学历厂
#
399953次浏览
1424人参与
#
TCL求职进展汇总
#
152146次浏览
665人参与
#
给工作过的公司写一条大众点评,你会怎么写?
#
11159次浏览
131人参与
#
春招已经启动啦 硬件uu开始投了吗?
#
124138次浏览
771人参与
#
拿到offer之后,可以做些什么
#
103640次浏览
506人参与
#
我是XXX,请攻击我最薄弱的地方
#
72618次浏览
490人参与
#
中国电信笔试
#
39752次浏览
363人参与
#
入职第一天,你准备什么时候下班
#
117858次浏览
515人参与
#
通信/硬件的薪资开多少,才值得去?
#
76335次浏览
406人参与
#
烂工作和没工作哪个更痛苦?
#
18351次浏览
273人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务