高德机器学习算法二面-日常实习
1.项目的拷打与反问,比一面要刁钻一些
2.问了GRPO和DPO的公式,后者没答出来
3.问了DRPO,为什么可以把散度去掉,没答上来
4.为什么要重要性采样
5.讲一下注意力机制,交叉注意力,为什么除以根号d
6.介绍一下什么情况下会出现梯度爆炸和梯度消失,为什么,出现了这种情况模型会怎么样
7.反问
2.问了GRPO和DPO的公式,后者没答出来
3.问了DRPO,为什么可以把散度去掉,没答上来
4.为什么要重要性采样
5.讲一下注意力机制,交叉注意力,为什么除以根号d
6.介绍一下什么情况下会出现梯度爆炸和梯度消失,为什么,出现了这种情况模型会怎么样
7.反问
全部评论
感觉问的不多啊
一共就二面技术吧
感觉还顺利吗?
相关推荐
点赞 评论 收藏
分享
查看14道真题和解析 点赞 评论 收藏
分享
点赞 评论 收藏
分享