智谱一面

经典过简历项目,重点问了最近这段的实习经历的主要工作,并且面试官的提问全程都非常落地,投递的Infra岗位,提问感觉像是在拷打算法,罗列几个回答的不太好的问题:

1、你们的场景是如何使用并行策略的?比如TP/DP等
答:采用TP2,DP8,EP16的单机16卡的并行策略

2、接着问:TP和DP应用在哪个权重计算的位置,并且两者是如何进行协同的?
答:TP/DP应用在Attention+FFN结构中的Attention,MoE模型的FFN使用EP,如何协同没回答上来,问了很久这个地方,最后和面试官说抱歉了,这部分的工作我没有具体落地做过,所以没有仔细研究过,然后面试官很有耐心的给我讲了一遍这部分的原理,也算是学习了

3、问我对推理Infra调度方面的策略有没有了解过,比如动态批处理...等几个调度方面的工作
答:简单描述了一下动态批处理的机制,主动说没有做过这方面的落地

4、还问了对于推理框架的KVCache管理策略有没有了解过?
答:介绍了一下vLLM社区的PageAttention,但是介绍的也非常粗糙,说类似于传统OS中的页表管理,并且言多必失,我说这个Page大小需要被精心设计,不能过大也不能过小,然后被拷问了为什么不能过大以及为什么不能过小的原因,感觉回答的也不是很好,被用例子拷打了

接下来就是手撕阶段了,手撕也比较抽象,手撕的是MoE层的Dispatch过程,我用C++写的:

输入是token的gating_scores和k,要求返回k个专家分配到的对应的token_id

这个写的比较艰难吧,写的速度比较慢,最后时间不太够了,面试官看了我前面的实现代码和我说:思路我看了一下基本上是正确的,时间不够了也没叫我接着讲思路,就说那我们今天就到这里吧

PS:面试过程感觉面试官非常有耐心,真的非常专业,实打实的一线开发人员,并且也乐于分享,回答不上来或者回答错误的问题面试官都耐心的给我讲解了,感觉自己发挥的不是很好,感觉虽然过的概率不大,但还是希望智谱能给个机会

#秋招##我的秋招日记##发面经攒人品##牛客AI配图神器##智谱AI#
全部评论

相关推荐

03-25 11:22
已编辑
门头沟学院 算法工程师
📍面试公司:京东infra一面(更新2026/03/25已挂)🕐面试时间:2026/03/23💻面试岗位:ai infra❓面试问题:零、查户口,问我啥时候毕业,哪里人,哪个专业,手头上有没有offer,面过其他什么公司?(简历上有但是会问)一、项目拷打(十分钟)二、八股(二十五分钟)1、讲一下大模型推理优化有些方法?                                      ——(这个问的很宽泛,可以从各方面回答)2、你刚刚说到有pageattention,这个具体是什么?               ——(上个问题的追问)3、Flashattention为什么能加速,计算过程是什么?4、你有讲到PD分离机制,那么如何实现调度队列?5、PD分离的时候chunk prefill是指同一个请求的PD插入吗?      ——(这里回答说A的prefill chunk过程中插入B的decoder,而不是A的decoder)6、C++的多态如何实现?7、你刚刚说的虚函数是怎么实现多态的,请具体说说看?8、你说了虚函数表,那么虚函数表里面的函数顺序是怎么样的?是按照声明顺序吗?   ——(这个问题我没答好)三、手撕(快排)(十五分钟)没写出来😭,其他排序都会写,就这个忘了,我又炸了。。。。。。/(ㄒoㄒ)/~~四、反问1、公式一问(我今天表现怎么样?对我有什么建议吗?)答:整体表现还可以,快排写不出来很不应该,我们这边很重视这个代码能力。(意思是寄/(ㄒoㄒ)/~~)2、他都这么说了,我也不好意思再问下去了。🙌面试感想:大概是寄了,就当积攒经验了,还有26届的同学还在找工作吗,可以交流交流看看。
查看10道真题和解析
点赞 评论 收藏
分享
03-19 22:04
江西师范大学
点赞 评论 收藏
分享
评论
5
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务