26校招拼多多LLM算法二面 被横向挂
总体感觉不错,估计是太卷了。。。
1. 手撕:给定 rand(7)(随机选取 1-7)实现 rand(10)
2. 平均调用 rand(7) 次数是多少?
3. grpo是什么?最耗费时间是哪一步?
4. grpo 长度衰减怎么做的?公式输入给我
5. grpo 计算 loss 时候如何做重要性采样?有什么改进点?
6. 你grpo 用了几张卡,大概多少 h,数据用了多少?
1. 手撕:给定 rand(7)(随机选取 1-7)实现 rand(10)
2. 平均调用 rand(7) 次数是多少?
3. grpo是什么?最耗费时间是哪一步?
4. grpo 长度衰减怎么做的?公式输入给我
5. grpo 计算 loss 时候如何做重要性采样?有什么改进点?
6. 你grpo 用了几张卡,大概多少 h,数据用了多少?
全部评论
相关推荐
02-07 10:52
复旦大学 Java
今天的算法题刷了吗:哎,职场向来如此,能遇到好mentor不容易,这些气不必过意不去,来日方长,算是知道mt也不是真心待你,先做好自己的事情,保证交付!用实力和态度说话 点赞 评论 收藏
分享

查看9道真题和解析