11.3阿里高德大模型实习二面(已oc

二面
1.先介绍项目
2.问了一些关于项目背景的问题问一些微调时候的显卡、参数设置,问的很细
3.显存计算
4.问几个强化学习方法,DPO、PPO、GRPO、DAPO等以及顺道提了一嘴看的一些别的公司的强化学习改进方法(这里因为之前别的面试被拷打的很深,所以私底下认真的看了每一篇论文从原理到公式到数据形式,甚至动手用trl verl试了一遍,所以回答的特别细致)
5.因为提到用过verl所以详细问了一下verl
6.手撕-力扣中等难度题-698划分为k个相等的子集
全部评论

相关推荐

11-07 15:41
暨南大学 C++
用微笑面对困难:我面试时候,就说了句”不愧是徐波的兵“他就破房了说是
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务