11.3阿里高德大模型实习二面(已oc
二面
1.先介绍项目
2.问了一些关于项目背景的问题问一些微调时候的显卡、参数设置,问的很细
3.显存计算
4.问几个强化学习方法,DPO、PPO、GRPO、DAPO等以及顺道提了一嘴看的一些别的公司的强化学习改进方法(这里因为之前别的面试被拷打的很深,所以私底下认真的看了每一篇论文从原理到公式到数据形式,甚至动手用trl verl试了一遍,所以回答的特别细致)
5.因为提到用过verl所以详细问了一下verl
6.手撕-力扣中等难度题-698划分为k个相等的子集
1.先介绍项目
2.问了一些关于项目背景的问题问一些微调时候的显卡、参数设置,问的很细
3.显存计算
4.问几个强化学习方法,DPO、PPO、GRPO、DAPO等以及顺道提了一嘴看的一些别的公司的强化学习改进方法(这里因为之前别的面试被拷打的很深,所以私底下认真的看了每一篇论文从原理到公式到数据形式,甚至动手用trl verl试了一遍,所以回答的特别细致)
5.因为提到用过verl所以详细问了一下verl
6.手撕-力扣中等难度题-698划分为k个相等的子集
全部评论
相关推荐
11-07 15:41
暨南大学 C++ 点赞 评论 收藏
分享
点赞 评论 收藏
分享

查看7道真题和解析