算法打工人阿旺

02-22 21:56 中山大学算法工程师发布于山东

关注

大厂大模型算法岗推理类面试题总结

1️⃣大模型推理优化方面
KV Cache 、PagedAttention 、FlashAttention 等技术，提升吞吐和显存利用率。

2️⃣高频考点
vLLM 与 PagedAttention
KV Cache 原理与优化
推理加速综合策略

3️⃣公司考察侧重点差异
💞字节跳动：全面覆盖推理优化、推荐系统、多模态等多个方向，考察系统化思维能力
👀腾讯：偏重推理框架（ vLLM 、
FlashAttention ）和长上下文优化
🍎美团／滴滴：关注实用化推理加速技术选型和实践经验

4️⃣面试准备建议
➡➡掌握核心原理：深入理解 vLLM 的
PagedAttention 、 KV Cache 、 FlashAttention 核心技术的实现机制。➡➡积累实战经验：准备具体的优化案例，包括量化效果、延迟提升数据等量化指标。
➡➡构建系统视角：不仅要懂算法原理，还要了解系统资源调度、并发处理等工程实践。

⭕如果你现在：
- 春招/秋招没方向
- 简历没人看
- 面试总挂
- 不知道怎么准备
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

02-05 15:43

已编辑

江南大学算法工程师

大厂问什么：2025-26 算法工程师面试常见问题整理（阿里系）

上班摸鱼，翻了2025年至今牛客网的阿里系面经，包括阿里云智能、达摩院（通义实验室）、阿里云计算平台以及阿里妈妈等机构，整理了算法工程师的常见面试内容，希望对想冲大厂的你有所帮助^ ^ 核心架构演进：Transformer组件的细粒度考察 Transformer架构作为现代大模型的基石，其考察深度在2025年达到了前所未有的水平。面试官默认候选人已经熟悉基本结构，转而主要攻击架构中的具体组件选型及其背后的数学原理。 位置编码（Positional Encoding）：从绝对到相对的演变  RoPE (Rotary Positional Embeddings): 42次 ALiBi (Atten...

点赞评论收藏

分享

02-10 07:20

北京大学算法工程师

抖音首页短剧推荐算法三面ld面

项目一 1.动机，模型结构，label和loss，2.为什么不用....，3.迭代过程中的线上指标，4.遇到过什么困难是怎么解决的5.介绍一下生成式推荐现在的几种范式6.如果让你做emb量化，你会怎么做7.为什么选用RQ–kmeans8.详细讲一下balanced RQ–kmeans9.讲一讲评估码本质量的几种办法10.下游直接使用sid生成效果往往不好，讲一讲有哪些改进方法手撕交叉熵编辑距离

查看12道真题和解析

点赞评论收藏

分享

02-03 17:17

中国科学院计算技术研究所研发工程师

阶跃星辰 一面聊项目 几本无八股 30mins结束两小时后通知通过 晚上约二面二面 让我介绍项目 问了SVD 还有kv cache项目讲的一坨 （有些忘了 + 当天第四面神智不清了）反问哪里不足 说我不熟悉我的项目第二天下午通知挂蔚来汽车更是灾难级别表现，感觉不是很match，我投错了。面试官说不重要，只要能来干活就行。问了问项目，然后手撕旋转mxn 矩阵一格，矩阵从外到内层数为0,1,2……什么偶数层顺时针旋转 奇数逆时针旋转。不会换了道题 翻转链表（a，b）部分，a，b为节点位置，没写出来，只会写翻转链表[哭惹R]总之一坨

查看5道真题和解析

点赞评论收藏

分享

02-24 14:52

已编辑

吉林大学测试工程师

总结下秋招被问到的关于AI的面试题

大致回忆下，给各位牛u一个参考，不区分公司了，我是测试/测开方向的，被问到AI主要也是实习的时候有使用到相关平台1.AI有使用过吗？2.模型幻觉如何解决？你提到使用rag检索本地知识集，召回率你有关注过吗3.RAG，functioncall，mcp了解么，简单说下说说原理4.有过微调经验吗？5.有对比使用过不同的模型吗？各个模型的优缺点有了解过吗6.模型澄清是什么？AI如何解析dom树？AI无法解决的有兜底方案吗7.有没有使用Ai coding帮助自己开发之类的8.有做过模型效果评测吗？9.Agent是什么10.websocket和sse区别是什么11.你觉得从哪些方面可以引入AI来帮助我们测试人员开发一个测试工具12.用AI生成测试用例,覆盖率不全怎么办13.如何设计出一个高质量的prompt14.针对AI生成的结果你会如何进行测试？对于AI回答的准确性要怎么测试15.playwright mcp了解吗16.大模型对于一些图片/文字的识别度不高，会出现幻觉问题，可能会导致生成的测试用例不够全面，给我讲讲你们是如何克服这个问题的感觉现在所有公司都要懂AI的人了不过就秋招面试体验来说，问的都是一些比较宽泛的问题，并不很难

牛客20205351...：举报了

掌握什么AI技能，会为你...

点赞评论收藏

分享

02-28 08:30

门头沟学院机器学习

字节AI算法二面好难啊

发点面经攒攒人品1、你在线上或离线训练时，过拟合怎么处理？直接说你最有效的三个方法和拿到的收益。2、把 BN 讲透：原理是什么；训练期和推理期用的统计量有何不同；跟 LN、GN 比，分别什么时候用、怎么取舍。3、分类和回归你最常用哪些损失？你更偏好哪几个，为什么（从鲁棒性、梯度、数值稳定性上谈）。4、L1 和 L2 正则你怎么选？它们各自的效果与风险是什么，工程里你是怎么权衡的。5、二元和多分类的交叉熵你怎么写？在工程里你怎么做数值稳定实现。6、AUC 到底在统计上代表什么？你怎么计算它，在线上业务里你如何解释“这次 AUC 提升”的含义。7、你做 CTR/CVR/CTCVR 联合建模时，ESMM/ESMM2 是怎么推导与工程落地的？线上到底带来了什么收益。8、Transformer 里因果注意力的 Q/K/V 各从哪来？Mask 具体怎么实现。9、Scaled Dot‑Product Attention 为啥要除以 √dk？如果不除会出什么数值或训练问题。10、把 Transformer / Decoder‑only 的整体结构过一遍，各个组件分别在干什么，有哪些常见变体。11、位置编码这条线你怎么选：绝对 PE、相对 PE、RoPE 各自的思路、优势和局限，结合你的项目谈取舍。12、长上下文怎么搞？Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力，你的实战方案是什么。13、KV Cache 在训练和推理中的差异是什么？它的加速价值有多大，吞吐与延迟你是如何权衡的，vLLM/paged‑attention 需要注意什么。14、PEFT 方案里（LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter）你怎么选？说说稳定训练的经验。15、SFT 和对齐（RLHF/DPO/IPO/PPO）原理差在哪？在不同数据与资源条件下，你怎么选路线。16、RAG 系统你怎么设计？切分、索引、召回/重排、压缩/融合、兜底策略怎么串。17、提示词工程你是怎么搞的？System/角色/约束/分步指令怎么写，如何防越狱

查看17道真题和解析

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生至暗时刻 #

6814次浏览 127人参与

# AI求职记录 #

3003次浏览 137人参与

# 神州信息求职进展汇总 #

2238次浏览 47人参与

# 交出你的校招焚诀 #

2337次浏览 53人参与

# 你见过最离谱的招聘要求是什么？ #

260749次浏览 1758人参与

# 面试___岗的必刷题单 #

3882次浏览 68人参与

# 通信和硬件还有转码的必要吗 #

92838次浏览 603人参与

# 机械制造薪资爆料 #

1950641次浏览 11058人参与

# AI面试问题分享 #

6128次浏览 137人参与

# 哪些公司开暑期实习了？ #

7263次浏览 59人参与

# 三月的小目标 #

4112次浏览 82人参与

# 春招开局，你有保底offer吗？ #

11079次浏览 117人参与

# 实习生的生存小技巧 #

3370次浏览 78人参与

# 你经历过哪些AI幻觉？ #

2299次浏览 49人参与

# 小厂一定不能去吗？ #

12755次浏览 125人参与

# 找AI工作应该卷什么？ #

1554次浏览 37人参与

# 薪资爆料 #

387788次浏览 2159人参与

# 面试时间长是好事吗？ #

129728次浏览 742人参与

# 参加哪些竞赛对找工作有帮助？ #

31310次浏览 234人参与

# 你今年的保底offer是哪家 #

172178次浏览 722人参与

# 十二月请对我好一点 #

84745次浏览 688人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务