【暑期实习】阿里云AI infra三面复盘
更像项目深聊,没有八股和编程题
这场阿里云 AI Infra 三面,整体感觉和前两面不太一样。前面几轮多少还有一些“项目追问”的紧张感,这一轮更像是一次围绕经历、学习路径和工程实践展开的深聊。面试官上来没有直接问技术细节,而是先从我导师现在在做什么、我为什么会从偏深度学习慢慢转到 AI Infra 这个方向聊起,也问了我本科阶段做的东西、现在在做的东西,和导师那边的研究之间到底有什么关联。我这里主要是把自己的路线讲清楚:不是突然转方向,而是从做模型、做工程、做性能相关的事情慢慢往更底层走,最后发现自己确实更喜欢算子优化、系统性能和工程实现这类工作。整体上,这一段更像是在看你的路径是不是自洽。
后面主要还是围绕项目和经历展开,但形式上更接近聊天,而不是那种一问一答式拷打。面试官让我概括我是怎么学 AI 的,学习路径是什么,从哪里开始,怎么一路学到现在的项目。我就大概讲了自己从基础课程、模型理解、工程实践,再到后面慢慢接触 CUDA、量化、算子优化、profiling 这些内容的过程,也讲了自己会怎么用工具、怎么查资料、怎么把学习真正落到项目里。这个问题看起来不难,但其实挺考验你能不能把自己的成长路径讲清楚,而不是只说“我学过这个、做过那个”。
接着就是实习经历的考察。这部分重点不是考八股,而是想看你到底干了什么活。面试官会追问,比如你平时做的算子开发工作流是什么样的、你在开发过程中会遇到哪些问题、你是怎么一步步把一个算子做出来的、这个算子开发的背景是什么,以及你怎么判断自己开发出来的东西是正确的。我整体感觉,这一轮特别强调“工程真实性”——不是问你懂不懂某个概念,而是问你平时真正在怎么做事。比如从需求怎么来、实现怎么落、测试怎么做、结果怎么验证,这些都比背理论更重要。
中间有个我印象挺深的问题,是他专门和我探讨在实际工作中怎么用 AI 工具解决问题。他问得不是“你会不会用 AI”,而是比较具体:如果你跟 AI 工具协作时,上下文变长了,记忆丢失了,你怎么办。我当时其实没有特别高级的答案,主要说的是自己会尽量让 AI 每执行一步就生成一个简单的 markdown 记录,写清楚这一步做了什么、造成了什么影响、当前问题背景是什么;等感觉上下文开始丢失时,就让 AI 回头重新读这个文档,再继续做。他听完后评价是,这个办法虽然有点笨,但确实是个办法。后来我自己又补了一句,真正更合理的做法还是尽量把大任务解耦,拆成一个个小任务去处理,不然任务规模一大,单纯靠补上下文其实很难解决根本问题。这个问题我觉得挺有意思,因为它不是传统面试题,但很能看出来你平时是不是在真实使用这些工具。
后面进入反问环节时,我先问了后续流程。他说后面可能还会有一到两面。然后我又问了团队在做什么。我的理解是,这个团队现在有几类工作,一类是基于卡间通信、互联、多卡相关的一些开发,另一类是偏底层的大模型算子优化工作。我当时还特意继续问了一下,这种多卡互联更偏什么方向,听下来更像是围绕他们自己的体系和底层能力展开,而不是单纯套现成方案。还有一部分是围绕大型模型做一些底层算子优化,也是比较偏基础设施和底层实现的。最后他也问了我的地点意向,我这边表达的是北京和深圳会优先考虑,杭州和上海放在第二梯队。
整体下来,这一轮最大的感觉是:更看重你有没有真实做过事情、有没有形成自己的工程方法,而不是看你八股背得多不多。没有编程题,也没有特别明显的八股考察,更像是在判断你是不是一个能做事、能持续成长、方向也比较清晰的人。对我自己来说,这一轮相对轻松一些,但也更考验表达,因为你要把“自己到底怎么做事”讲得让人信服。
反问环节我问了问如果过了以后,还有没有面试?面试官说可能还有1-2轮吧(无敌了……)
#暑期实习##面试复盘##aiinfra##阿里云#12345
