度小满大模型算法 实习一面
欢迎友好讨论,信息共享
1.项目拷打
2.moe架构的专家路由是对每个token路由还是对每个序列路由
3.如果是对每个token路由,那么代码实现时是如何避免写对每个token的循环的
4.部署qwen3合成数据时候用的什么框架
5.在用qwen3-32b做推理时显存占用是多少
6.在多卡上部署模型时,用了什么策略使得GPU利用率能拉满
7.讲一讲vllm框架,他是如何保证GPU利用率的
8.讲讲flash attention
9.算法题:反转链表
1.项目拷打
2.moe架构的专家路由是对每个token路由还是对每个序列路由
3.如果是对每个token路由,那么代码实现时是如何避免写对每个token的循环的
4.部署qwen3合成数据时候用的什么框架
5.在用qwen3-32b做推理时显存占用是多少
6.在多卡上部署模型时,用了什么策略使得GPU利用率能拉满
7.讲一讲vllm框架,他是如何保证GPU利用率的
8.讲讲flash attention
9.算法题:反转链表
全部评论

看着问的还行啊
相关推荐
歌尔微电子 春招算法岗 求了解下工作强度 22Kx14 我也不知道年终到底多少 硕士其他 点赞 评论 收藏
分享
查看11道真题和解析