网络冲浪十级选手兼潜水冠军

03-03 13:35 门头沟学院机器学习

关注

AI Infra面经攒人品版

继续来分享下之前的面经~欢迎友好讨论，信息共享
1️⃣算法题：手撕内存池（要求支持类似new Foo[], delete []功能)，c++如何比较两个float是否相等，LRU，岛屿个数，二叉树的层序遍历，hamming weight，k-coverage intervals

2️⃣torch手撕题: LoRA adapter

3️⃣cuda手撕题：
1- 支持torch broadcast的4D tensor的elementwise mul
2- A: (1, 256), B: (256, 128), C: (128, 256) ，计算 (A * B) * C
3- Embedding Sparse Feature Pooling：A是 100 万个离散 ID（0~999），B是 100 万个float，计算个长度为1000的float数组C，C[i] = \sum_{j s.t. A[j] = i} B[j]

4️⃣ai infra或算法八股：
1- llm的知识蒸馏放在预训练做是否合适
2- Hopper TMA的优点，调用方式，是否需要经过L1
3- Flash Attention v2为什么外层对Q循环，Flash Decoding的combine kernel耗时占比大概是多少
4- Mooncake kv-cache centric的PD分离
5- Dit的推理框架设计思路和LLM的有什么异同
6- 分析MLA decode的计算访存比，它和seqlen、batch size是否相关
7- diffusion model的训练和推理步骤，推理num_inference_steps为40时，为什么训练的timesteps仍要设成1000
8- 介绍dLLM，如何看待它和AR的区别
9- torch.repeat 和 torch.expand的区别
10- torchrun的启动参数有哪些，如何在Linux上批量kill包含torchrun的进程

全部评论

推荐最新楼层

04-11 12:44

香港中文大学（深圳）人工智能

【暑期实习】蚂蚁 AI Infra 三面复盘

这一轮更偏大模型、量化和推理基础理解这场蚂蚁 AI Infra 三面，整体感觉和前两轮又不太一样。前两轮更多是在深挖我已经做过的项目，这一轮虽然也会问项目，但明显更关注我对大模型推理、量化、KV Cache、attention 这些基础问题到底理解到什么程度。开头还是先做自我介绍，我主要讲了自己现在在做的几个方向：一段偏工程化的软件开发经历，一段偏算子和图优化的实习经历，以及自己在做的一个基于 Python extension 的量化推理 runtime 小项目。这一轮项目部分问得相对直接。面试官先让我展开讲了自己做的那个量化推理 runtime。我这边讲的是，基于一个开源 runtime 做...

查看15道真题和解析

点赞评论收藏

分享

03-23 12:54

门头沟学院 Java

快手 Ai infra一面拷打

继续来分享下之前的面经~欢迎友好讨论，信息共享1. 拷打项目2. 有没有了解过AF分离，他是为了解决什么问题，既然有PD分离了，为什么还要AF分离？3. 有没有读过flash attention的代码，V2比起V1做了哪些改进？细聊一下他是怎么改进的。有没有了解最近的V4版本？4. 大模型的一层有几个线性层？TP的时候怎么切的？这样子做的原因是什么？有什么思路优化中间的allreduce吗？5. 看过ray的底层实现吗？它有什么特性，你的课题研究中是怎么使用ray的？6. 聊一下你所找到的cuda gemm的优化方法7. leetcode 单词接龙

查看7道真题和解析

点赞评论收藏

分享

03-27 16:21

复旦大学 Python

AI infra应该学什么？

AI Infra 是未来 5–10 年非常确定的岗位方向之一，而且相比纯算法岗，门槛更工程化、需求更大、年龄更友好。AI Infra 技能栈你可以把技能栈理解为 4 层：第1层：基础工程能力（必须）这是门槛：LinuxPython / Go计算机网络操作系统DockerKubernetes数据库（MySQL / Redis）分布式系统基础API开发（FastAPI / Flask）并发 / 异步 / 队列（Kafka / RabbitMQ）这一层本质是：后端工程师能力第2层：AI工程能力这一层开始进入 AI Infra：PyTorch 基础模型推理（inference）模型部署（TorchSe...

s_ingulari...：你的入行路径和项目烂完了。你这个入行路径和项目就老老实实agent 开发吧

查看图片

从事AI岗需要掌握哪些技...

点赞评论收藏

分享

03-25 11:22

已编辑

门头沟学院算法工程师

AI infra应届春招

📍面试公司：京东infra一面（更新2026/03/25已挂）🕐面试时间：2026/03/23💻面试岗位：ai infra❓面试问题：零、查户口，问我啥时候毕业，哪里人，哪个专业，手头上有没有offer，面过其他什么公司？（简历上有但是会问）一、项目拷打（十分钟）二、八股（二十五分钟）1、讲一下大模型推理优化有些方法？                                      ——（这个问的很宽泛，可以从各方面回答）2、你刚刚说到有pageattention，这个具体是什么？               ——（上个问题的追问）3、Flashattention为什么能加速，计算过程是什么？4、你有讲到PD分离机制，那么如何实现调度队列？5、PD分离的时候chunk prefill是指同一个请求的PD插入吗？      ——（这里回答说A的prefill chunk过程中插入B的decoder，而不是A的decoder）6、C++的多态如何实现？7、你刚刚说的虚函数是怎么实现多态的，请具体说说看？8、你说了虚函数表，那么虚函数表里面的函数顺序是怎么样的？是按照声明顺序吗？   ——（这个问题我没答好）三、手撕（快排）（十五分钟）没写出来😭，其他排序都会写，就这个忘了，我又炸了。。。。。。/(ㄒoㄒ)/~~四、反问1、公式一问（我今天表现怎么样？对我有什么建议吗？）答：整体表现还可以，快排写不出来很不应该，我们这边很重视这个代码能力。（意思是寄/(ㄒoㄒ)/~~）2、他都这么说了，我也不好意思再问下去了。🙌面试感想：大概是寄了，就当积攒经验了，还有26届的同学还在找工作吗，可以交流交流看看。

查看10道真题和解析

点赞评论收藏

分享

04-11 12:49

已编辑

香港中文大学（深圳）人工智能

【暑期实习】阿里云 AI infra一面复盘

先做代码题，再深挖算子优化、图融合和量化这场阿里一面整体给我的感觉是，节奏比较紧，前面先处理了一个在线代码题，后面基本都是顺着项目经历往下深挖。代码题是“队列的最大值”，要求均摊 O(1) 地返回当前队列最大值，我当时用的是普通队列加单调双端队列这套常见思路：一个队列维护正常入队出队，另一个双端队列维护当前可能成为最大值的候选元素。这个题本身不算特别难，但相当于是先热一下身，也看你对基础数据结构是不是熟。后面的主体还是项目追问，而且问得挺细。面试官先从我做过的算子优化、图优化这些经历切进来，重点问的是：你到底怎么判断哪些地方值得优化，哪些算子值得单独提出来做性能优化，哪些链路值得做融合。我当时...

查看14道真题和解析

点赞评论收藏

分享

评论

1

11

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 父母问你工作找得怎么样，怎么回 #

5814次浏览 82人参与

# 面试被问期望薪资时该如何回答 #

389273次浏览 2172人参与

# 厦门银行科技岗值不值得投 #

19540次浏览 427人参与

# 从投递到OC，你用了多久 #

6844次浏览 60人参与

# 想从事Agent应该学习哪些技术？ #

1136次浏览 36人参与

# 哪些公司面试还在问八股？ #

2120次浏览 35人参与

# 什么人最适合大厂？ #

3220次浏览 31人参与

# AI时代还有必要刷leetcode吗？ #

1375次浏览 26人参与

# 有哪些公司在面试时考察AICoding？ #

2119次浏览 28人参与

# HR面都在聊什么？ #

2054次浏览 34人参与

# 哪一刻你突然觉得实习“有点值了” #

5467次浏览 48人参与

# 你的秋招第一面感觉怎么样 #

146317次浏览 814人参与

# 四大天坑是哪四家？ #

113645次浏览 246人参与

# 一人一道大厂面试题 #

131559次浏览 1328人参与

# 哪些公司一直卡在简历筛选 #

109238次浏览 377人参与

# 总结:哪家公司最喜欢泡池子 #

170715次浏览 614人参与

# 计算机有哪些岗位值得去？ #

393971次浏览 2861人参与

# 拿到offer之后，可以做些什么 #

106393次浏览 514人参与

# 春招至今，你收到几个面试了？ #

146087次浏览 1646人参与

# 说说你知道的学历厂 #

404931次浏览 1446人参与

# Agent面试会问什么？ #

45414次浏览 1556人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务