阿里智信 AI infra团队招实习生啦

职位描述
2021年4月,阿里集团成立智能信息事业群,聚焦AI技术在信息服务赛道的创新应用,从工具到服务,持续为用户提供高效、智能的互联网产品。智能信息事业群核心产品为夸克APP、UC浏览器、书旗小说、超级汇川等,以多APP矩阵,覆盖横跨各年龄段的数亿用户人群,服务超10万客户。目前我们正在用大模型服务于公司的多条业务线,作为智能信息的AI Infra团队,在这里你将深入参与到大模型的训练和推理中:
 1、参与大模型离线训练的效率和稳定性提升的工作;
 2、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作; 
3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模型能力建设和落地应用。
职位要求,具备以下一项或多项能力:
1. 熟悉C/C++、Python等至少一门编程语言,以及Linux下的开经验 
2. 了解常用机器学习算法,对文本/多模态大模型相关领域模型,有极佳的工程实现能力,了解TF/Pytorch/Jax等深度学习框架,有相关模型训练和模型效果优化者优先 
3. 了解大模型MegatronLM/Deepspeed/Colossal分布式训练框,了解模型量化、蒸馏、剪枝等模型优化原理和策略,有相关训练、调优经验优先
4. 了解或使用过使用包括vllm/tgi/tensorrtLLM等模型推理服务框架,有代码分析及实践经验优先 
5. 了解GPU/ASIC芯片,了解硬件系统架构,能够针对性的编写高性能的算子实现,有分析及调优能力 
5. 在训练/推理加速相关领域的研究和成果发表者优先 ,也欢迎有HPC或体系结构背景的铜须
同时我们还希望你
1、学习能力强,有良好的英文论文阅读能力,对新事物保有好奇心,并能快速适应新环境;
2、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;
3、对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。

base地点:广州,欢迎感兴趣的同学留言、私聊或发送简历到邮箱zhangmaoquan.zmq@alibaba-inc.com
全部评论

相关推荐

📍面试公司:小米🕐面试时间:2026/03/26(二十分钟草草收场,都不想去看结果就知道挂了)💻面试岗位:大模型推理优化❓面试问题:一、自我介绍二、八股问题拷打,其实上来就是手撕1、直接在编辑器上手撕MGA,要求写出init、forward、注意力层   ——丢人现眼了,基本不会写2、追问,不会写的话讲一下整个过程,输入到输出怎么样的?         ——讲了讲transformer,注意力机制3、vllm和sglang的底层代码有看过吗?                                          ——没看过(其实看过,但我不敢说,怕叫我写)4、kv cache有哪些加载方式?                                                        ——在胡言乱语,啊这个,啊那个5、PD分离机制是干什么的?你怎么实现的?                                   ——唯一能回答的问题6、有没有用vllm部署过模型?吞吐量是多少?                                 ——脑子昏了,沉默(跑了demo,没测过)7、MTP(可能是MCP?没听清)是什么,介绍一下?                     ——我估计想问Medusa?反正我没回答,沉默。到这他问不下去了。。。三、反问两个人尴尬一笑,没什么要问的了。🙌面试感想:应该是史上最无悬念的秒挂,第一个手撕不会之后我已经晕头转向了,加上昨天熬夜到五点,到后面我都有点不好意思了,感觉在浪费他的时间,在这里跟他道个歉😀。十月到现在算上开发+infra可能面了二十多家吧,大部分都是秒挂,感觉车企infra这块的要求都特别高吧,问的特别细,就是最新的技术一定都要掌握,这一块技术迭代感觉特别特别快,光背八股面经给我感觉不太行。鼠鼠也累了,但自觉已经尽力了。也感谢这些至少还给机会面试的公司吧,有些简历直接投垃圾桶里了。(希望下一届的同学早早准备,不要像鼠鼠一样还在为春招奔波)。
查看8道真题和解析
点赞 评论 收藏
分享
03-25 11:22
已编辑
门头沟学院 算法工程师
📍面试公司:京东infra一面(更新2026/03/25已挂)🕐面试时间:2026/03/23💻面试岗位:ai infra❓面试问题:零、查户口,问我啥时候毕业,哪里人,哪个专业,手头上有没有offer,面过其他什么公司?(简历上有但是会问)一、项目拷打(十分钟)二、八股(二十五分钟)1、讲一下大模型推理优化有些方法?                                      ——(这个问的很宽泛,可以从各方面回答)2、你刚刚说到有pageattention,这个具体是什么?               ——(上个问题的追问)3、Flashattention为什么能加速,计算过程是什么?4、你有讲到PD分离机制,那么如何实现调度队列?5、PD分离的时候chunk prefill是指同一个请求的PD插入吗?      ——(这里回答说A的prefill chunk过程中插入B的decoder,而不是A的decoder)6、C++的多态如何实现?7、你刚刚说的虚函数是怎么实现多态的,请具体说说看?8、你说了虚函数表,那么虚函数表里面的函数顺序是怎么样的?是按照声明顺序吗?   ——(这个问题我没答好)三、手撕(快排)(十五分钟)没写出来😭,其他排序都会写,就这个忘了,我又炸了。。。。。。/(ㄒoㄒ)/~~四、反问1、公式一问(我今天表现怎么样?对我有什么建议吗?)答:整体表现还可以,快排写不出来很不应该,我们这边很重视这个代码能力。(意思是寄/(ㄒoㄒ)/~~)2、他都这么说了,我也不好意思再问下去了。🙌面试感想:大概是寄了,就当积攒经验了,还有26届的同学还在找工作吗,可以交流交流看看。
查看10道真题和解析
点赞 评论 收藏
分享
评论
3
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务