遇到的一个面试题 这种该怎么回答

有这样一个场景,对一篇森林中的树木(有1000万)去实地记录了它很多维度的特征信息,比如说树的高度,树的种类,然后现在已经对于树的高度这个特征有些数据记录出错了,那我想尽可能准确的将这些错误的数据找出来。这个有啥方法吗。然后抽样了200条数据去看了,大约有3%的数据是错误的。

需要给出自己的思路,并能自圆其说
全部评论
不知道,我选择束手就擒
点赞 回复 分享
发布于 2023-04-02 11:45 内蒙古
先用已有数据训一个预测树高度的模型出来,然后按预测值和记录值之差降序排序,取前3%认为是错误数据,可能不是最优,但应该可行
点赞 回复 分享
发布于 2023-04-01 14:14 浙江

相关推荐

就只能3个月,但是要求长期全职实习
Swaying:你确实是能长期实习啊,但是你那时候有事也没啥办法嘛
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务