nlp面经常见考点分享(机器学习篇)

1、什么是分类,什么是回归?

答:分类与回归,本质上来讲是定量与定性的问题。回归问题的输出空间定义了一个度量,去衡量输出值与真实值的误差大小,例如:预测一瓶700毫升的可乐的价格(真实价格为5元)为6元时,误差为1;预测其为7元时,误差为2。这两个预测结果是不一样的。
对于分类问题,其度量空间是定性的,在分类问题中,只有分类正确错误之分,至于错误时是将Class 5分到Class 6,还是Class 7,并没有区别,都是在error counter上+1。
其次,二者在损失函数的使用上也是不同的,回归问题通常用均方误差损失,分类问题上用交叉熵损失

2、损失函数有哪些?为什么逻辑回归乃至神经网络要用交叉熵损失而不用均方误差损失?

L1损失
L2损失
交叉熵损失

其中是softmax回归求得的结果,是实际的类别。可以看出,交叉熵损失函数只计算真实类别对应的预测概率的损失,而不考虑其他的预测概率损失。
注意:首先,对于交叉熵或者欧氏距离,目标函数都不能保证是凸的,不过,神经网络中对分类问题使用交叉熵而不用欧氏距离是因为前者一般情况下可以收敛到更好的局部极小值点处,即一般情况下在精度上更好一些。
其次,使用交叉熵,在计算梯度时会约去复杂项,使得计算更简单:因为交叉熵损失求梯度是,如果激活函数使用logistic的话,logistic的梯度是**,两者结合可以把约去,这样梯度就成线性的,因此不会存在学习速度过慢的情况。
**为什么分类问题用交叉熵,回归问题用均方误差?

答:分类的问题中,最好检验准确度的模型就是这个预测对还是不对,对为1,不对为0。而回归问题采用均方误差是计算你的预测离真实值远不远。

3、你对决策树了解多少,GBDT用的是什么决策树?(回归树还是分类树),GBDT原理,xgboost原理

全部评论
请问这是面试什么公司的什么岗位呀?
点赞 回复 分享
发布于 2020-10-29 18:48

相关推荐

07-25 11:26
清华大学 Java
打开电脑,思绪又回到了7月份刚开始的时候,感觉这个月过的如梦如幻,发生了太多事,也算是丰富了我本就是平淡的人生吧太早独立的我习惯了一切都是自己做决定,拥有绝对的决定权,而且永远不会听取别人的建议。我就是那个恋爱四年出轨的男主啦,感觉既然在牛客开了这个头,那我就要做个有始有终的人。从我出轨到结束再到和女朋友和好如初真的太像一场梦了,短短的一个月我经历了太多,也成长了很多,放下了那些本就不属于我的,找回了那些我不该放弃的。我的人生丰富且多彩,但人不能一直顺,上天总会让你的生活中出点乱子,有好有坏,让你学会一些东西,让你有成长。我和女朋友的恋爱四年太过于平淡,日常除了会制造一些小浪漫之外,我们的生活...
段哥亡命职场:不得不说,我是理解你的,你能发出来足见你是个坦诚的人,至少敢于直面自己的内心和过往的过错。 这个世界没有想象中那样非黑即白,无论是农村还是城市,在看不见的阴影里,多的是这样的事。 更多的人选择站在制高点去谩骂,一方面是社会的道德是需要制高点的,另一方面,很多人不经他人苦,却劝他人善。 大部分的我们,连自己生命的意义尚且不能明晰,道德、法律、困境,众多因果交织,人会迷失在其中,只有真的走出来之后才能看明白,可是没走出来的时候呢?谁又能保证自己能走的好,走的对呢? 可是这种问题有些人是遇不到的,不去追寻,不去探寻,也就没了这些烦恼,我总说人生的意义在过程里,没了目标也就没了过程。 限于篇幅,没法完全言明,总之,这世界是个巨大的草台班子,没什么过不去了,勇敢面对,革故鼎新才是正确,祝你早日走出来。查看图片
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
2
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务