斑马智行大模型二面-日常实习
1.项目和八股
1.双向mamba和直接使用一个因果注意力有什么区别
2.shift具体是怎么实现的
3.针对你的 vllm 推理优化比赛,看过注意力分数吗
4.prefill 阶段和 decoder 阶段
5.你的方法如何降低 prefill 阶段的时间
6.这两个阶段对比而言,哪个阶段更耗时
7.ppo算法的流程
8.grpo 以及变体
2.手撕
最大连续和的子数组(dp)
3.反问
对实习生的期望,业务
1.双向mamba和直接使用一个因果注意力有什么区别
2.shift具体是怎么实现的
3.针对你的 vllm 推理优化比赛,看过注意力分数吗
4.prefill 阶段和 decoder 阶段
5.你的方法如何降低 prefill 阶段的时间
6.这两个阶段对比而言,哪个阶段更耗时
7.ppo算法的流程
8.grpo 以及变体
2.手撕
最大连续和的子数组(dp)
3.反问
对实习生的期望,业务
全部评论
面了这么久还没确定啊 大模型岗感觉好难
相关推荐
02-04 15:27
成都理工大学 Java 点赞 评论 收藏
分享
查看4道真题和解析