鹅厂实习一面 Ai infra
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1. 聊项目
2. 聊一下chunk prefill,他是为了解决什么问题而提出的
3. 说一下reduce-scatter和all-to-all通信
4. 怎么减少launch kernel overhead
5. cuda编程中bank conflict是什么,怎么解决?
6. 场景题:一个大集群中有节点内有nvlink,节点间部分机器有rdma,怎么去设计你的分布式推理方案
代码题:k个一组翻转链表
1. 聊项目
2. 聊一下chunk prefill,他是为了解决什么问题而提出的
3. 说一下reduce-scatter和all-to-all通信
4. 怎么减少launch kernel overhead
5. cuda编程中bank conflict是什么,怎么解决?
6. 场景题:一个大集群中有节点内有nvlink,节点间部分机器有rdma,怎么去设计你的分布式推理方案
代码题:k个一组翻转链表
全部评论
相关推荐
查看4道真题和解析