阿里智信AI infra团队招实习生

职位描述
2021年4月,阿里集团成立智能信息事业群,聚焦AI技术在信息服务赛道的创新应用,从工具到服务,持续为用户提供高效、智能的互联网产品。智能信息事业群核心产品为夸克APP、UC浏览器、书旗小说、超级汇川等,以多APP矩阵,覆盖横跨各年龄段的数亿用户人群,服务超10万客户。目前我们正在用大模型服务于公司的多条业务线,作为智能信息的AI Infra团队,在这里你将深入参与到大模型的训练和推理中:
 1、参与大模型离线训练的效率和稳定性提升的工作;
 2、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作; 
3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模型能力建设和落地应用。
职位要求,具备以下一项或多项能力:
1. 熟悉C/C++、Python等至少一门编程语言,以及Linux下的开经验 
2. 了解常用机器学习算法,对文本/多模态大模型相关领域模型,有极佳的工程实现能力,了解TF/Pytorch/Jax等深度学习框架,有相关模型训练和模型效果优化者优先 
3. 了解大模型MegatronLM/Deepspeed/Colossal分布式训练框,了解模型量化、蒸馏、剪枝等模型优化原理和策略,有相关训练、调优经验优先
4. 了解或使用过使用包括vllm/tgi/tensorrtLLM等模型推理服务框架,有代码分析及实践经验优先 
5. 了解GPU/ASIC芯片,了解硬件系统架构,能够针对性的编写高性能的算子实现,有分析及调优能力 
5. 在训练/推理加速相关领域的研究和成果发表者优先 ,也欢迎有HPC或体系结构背景的铜须
同时我们还希望你
1、学习能力强,有良好的英文论文阅读能力,对新事物保有好奇心,并能快速适应新环境;
2、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;
3、对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。

base地点:广州,欢迎感兴趣的同学留言、私聊或发送简历到邮箱zhangmaoquan.zmq@alibaba-inc.com
全部评论

相关推荐

03-20 15:35
深圳大学 golang
人生第一次面腾讯 部门是CSIG的技术与产品 3.16晚上面的 大概1h 问的问题挺多的 手撕给了两道10分钟就写完了 反问环节面试官评价也挺正向 还说两道手撕都很快写出来了挺不错的(他说他一般给两道是会让候选人自己选一道的) 感觉自己发挥挺正常的 以为应该可以过 结果八点面完九点就给挂了 不知道是不是kpi面 人生中第一场鹅面试就这么狠狠被挂掉了1. 自我介绍 顺便介绍两个项目2. 你说到你的项目是微服务架构 那你说说微服务是什么?3. 你的评价系统用到了Canal 你为什么要用Canal?4. 面试官说他记得Canal的配置是比较复杂的 他说有很多复杂的配置文件 问我当时是怎么去配置的 有没有遇到什么难题?5. 你的后台消费脚本怎么判断一条语句是DDL语句还是DML语句的?(刚好有考虑到这一点就回答了根据Kafka里面的消息来判断)6. 那怎么判断是不是DCL语句呢?(这个确实没考虑到)7. 你的项目用到了SSE 说一下SSE和http有什么区别 SSE是单向的吗?8. 你的RAG项目是为什么架构的?为什么要使用Eino框架 它在里面起到了什么作用?9. 你的文档存到向量数据库的索引是怎么设计的?10. 召回文档的时候是怎么召回的?召回的是文档的ID还是文档的内容?11. 说一下OSI七层网络模型和TCP-IP的四层网络模型 每一层分别有哪些东西介绍一下(只记得四层 七层的没说全 太久没看了忘了)12. 说一下TCP的三次握手和四次挥手13. Go里面的error和panic有什么区别?14. 那panic是怎么捕获的 说一下15. 那Defer是用来干什么的?16. Go里面的Context有了解过吗 介绍一下Context可以用来做什么?17. 说一下Go语言里面的零值18. 为什么两个项目一个用Gin框架一个用Kratos框架?19. 为什么手撕代码一道题用C++、一道题用Go? (说之前打编程比赛的时候习惯用C++写算法题 链表和二叉树的题目就习惯用C++写)手撕代码出了两道都是简单难度的leetcode 但是第二道不能额外开辟新数组 用逆向双指针就可以解决了:1. 判断链表是否有环 (自己写输入输出构建链表)2. 合并两个有序数组(要求不可以额外开一个新数组 只能使用常量级别的额外空间)
查看19道真题和解析
点赞 评论 收藏
分享
03-25 11:22
已编辑
门头沟学院 算法工程师
📍面试公司:京东infra一面(更新2026/03/25已挂)🕐面试时间:2026/03/23💻面试岗位:ai infra❓面试问题:零、查户口,问我啥时候毕业,哪里人,哪个专业,手头上有没有offer,面过其他什么公司?(简历上有但是会问)一、项目拷打(十分钟)二、八股(二十五分钟)1、讲一下大模型推理优化有些方法?                                      ——(这个问的很宽泛,可以从各方面回答)2、你刚刚说到有pageattention,这个具体是什么?               ——(上个问题的追问)3、Flashattention为什么能加速,计算过程是什么?4、你有讲到PD分离机制,那么如何实现调度队列?5、PD分离的时候chunk prefill是指同一个请求的PD插入吗?      ——(这里回答说A的prefill chunk过程中插入B的decoder,而不是A的decoder)6、C++的多态如何实现?7、你刚刚说的虚函数是怎么实现多态的,请具体说说看?8、你说了虚函数表,那么虚函数表里面的函数顺序是怎么样的?是按照声明顺序吗?   ——(这个问题我没答好)三、手撕(快排)(十五分钟)没写出来😭,其他排序都会写,就这个忘了,我又炸了。。。。。。/(ㄒoㄒ)/~~四、反问1、公式一问(我今天表现怎么样?对我有什么建议吗?)答:整体表现还可以,快排写不出来很不应该,我们这边很重视这个代码能力。(意思是寄/(ㄒoㄒ)/~~)2、他都这么说了,我也不好意思再问下去了。🙌面试感想:大概是寄了,就当积攒经验了,还有26届的同学还在找工作吗,可以交流交流看看。
查看10道真题和解析
点赞 评论 收藏
分享
评论
1
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务