上海某中厂AI 大模型校招面经
继续来分享下之前的面经~欢迎友好讨论,信息共享
1.介绍项目
2.了解其他开源推理框架怎么实现的吗?
3.主流的推理框架包含哪些部分?
4.推理服务框架性能的评判标准和数据?什么单位,什么尺度?
5.解释什么叫延迟?吞吐?
6.Llama7B中的7B是什么?单位是什么?
7.Q、K、V计算公式
8.Q的参数?
9.GQA和MHA的区别
10.MLA是什么?
11.warp的shuffle指令是什么?具体适用什么算法?
12.pytorch的eager模式是什么?
13.C++中static会用在哪些场景?
14.Llama模型哪里下载的?多大?
编程:
写reduce_sum的算子
判断子树存在问题
1.介绍项目
2.了解其他开源推理框架怎么实现的吗?
3.主流的推理框架包含哪些部分?
4.推理服务框架性能的评判标准和数据?什么单位,什么尺度?
5.解释什么叫延迟?吞吐?
6.Llama7B中的7B是什么?单位是什么?
7.Q、K、V计算公式
8.Q的参数?
9.GQA和MHA的区别
10.MLA是什么?
11.warp的shuffle指令是什么?具体适用什么算法?
12.pytorch的eager模式是什么?
13.C++中static会用在哪些场景?
14.Llama模型哪里下载的?多大?
编程:
写reduce_sum的算子
判断子树存在问题
全部评论
相关推荐
03-05 19:01
哈尔滨工业大学 golang 点赞 评论 收藏
分享
查看7道真题和解析