斑马智行大模型二面-日常实习

1.项目和八股

1.双向mamba和直接使用一个因果注意力有什么区别
2.shift具体是怎么实现的
3.针对你的 vllm 推理优化比赛,看过注意力分数吗
4.prefill 阶段和 decoder 阶段
5.你的方法如何降低 prefill 阶段的时间
6.这两个阶段对比而言,哪个阶段更耗时
7.ppo算法的流程
8.grpo 以及变体

2.手撕
最大连续和的子数组(dp)
3.反问
对实习生的期望,业务
全部评论
面了这么久还没确定啊 大模型岗感觉好难
点赞 回复 分享
发布于 02-04 21:20 湖南

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务