遇到的一个面试题 这种该怎么回答
有这样一个场景,对一篇森林中的树木(有1000万)去实地记录了它很多维度的特征信息,比如说树的高度,树的种类,然后现在已经对于树的高度这个特征有些数据记录出错了,那我想尽可能准确的将这些错误的数据找出来。这个有啥方法吗。然后抽样了200条数据去看了,大约有3%的数据是错误的。
需要给出自己的思路,并能自圆其说
需要给出自己的思路,并能自圆其说
全部评论
不知道,我选择束手就擒
先用已有数据训一个预测树高度的模型出来,然后按预测值和记录值之差降序排序,取前3%认为是错误数据,可能不是最优,但应该可行
相关推荐
点赞 评论 收藏
分享
2025-12-25 13:37
门头沟学院 Java
sneak@0729:标准回答:我期望在广州,但我个人其实对地域选择不敏感,更看重公司的前景和个人长期发展。因此base地具体以公司安排为准 点赞 评论 收藏
分享