大厂算法Offer情报官

2025-06-06 09:56 门头沟学院算法工程师发布于天津

关注

大模型面经每日总结（京东大模型实习）

#大模型# #面经##京东#
1. 基础概念题：什么是大模型核心加速技术中的 “算子融合”？举例说明其作用。
答案要点：
算子融合是将多个连续计算算子合并为一个，减少计算图中的节点数和显存读写次数，降低延迟。
举例：如将 Transformer 中的 Add（残差连接）与 RMSNorm（归一化）融合，减少两次内存访问，提升推理速度。
2. 技术原理题：Flash Attention V2 如何优化注意力计算效率？与 V1 的核心区别是什么？
答案要点：
• V1：通过分块计算注意力，减少显存占用（避免存储所有中间键值对）。
• V2：引入 “内外循环交换策略”，将矩阵乘法的循环顺序调整为更适合 GPU 并行计算的模式，进一步提升计算效率，尤其在长序列场景下加速明显。
3. 量化技术中，FP8、INT4 AWQ、INT4-FP8 AWQ 的适用场景和压缩率有何差异？
4. RAG 系统中，文档切分粒度如何影响检索和生成效果？实际中如何确定最优粒度？

5.在长序列推理场景中，PagedAttention 和 Prefix Caching 分别解决什么问题？如何配合使用？
答案要点：
• PagedAttention：将 KV Cache 分块存储在非连续显存中，避免显存碎片，支持处理超长序列（如百万 Token）；
• Prefix Caching：缓存历史对话的 KV 对，跨请求复用，减少重复计算（如多轮对话中复用上文缓存）。
配合逻辑：
PagedAttention 解决显存限制，Prefix Caching 减少计算量，两者结合可提升长对话场景的效率和稳定性。

6. 在企业级推理场景中，如何根据需求选择量化方案？举例说明短文本高并发和长文本场景的优化策略。

实时客服系统用 INT4 量化加速响应；金融报告生成场景用 FP8+PagedAttention 处理数千 Token 输入。

全部评论

推荐最新楼层

01-20 10:09

西安电子科技大学 Java

27届高德一面

📍面试公司：高德地图🕐面试时间：2026.01.19❓面试问题：介绍实习项目为什么要使用CompletableFuture进行异步检索有其他方案的考量吗AOP如何做性能分析可以用web日志和nignx日志，用aop有其他考虑吗AOP底层原理JDK和CGLIB选型考虑分表的依据和实现shardingsphere底层如何实现分表和路由的分表是否考虑分布均匀，冷热数据如何解决冷热数据的问题Redis的GEO做了什么功能GEO的原理线程池的核心参数和如何设置这些参数核心线程和最大线程是否可以相等拒绝策略选择CallerRuns，是否可能阻塞主线程Redis的Set,Zset,Bitmap做了哪些功...

查看23道真题和解析

点赞评论收藏

分享

01-17 22:19

中山大学算法工程师

小红书LLM算法面经

1️⃣ 自我介绍2️⃣dpo训练对于系统问答的优化在哪里3️⃣提高模型的准确率核心是什么4️⃣rerank 用的什么模型5️⃣swiGLU 的改进6️⃣全参数微调 7B 需要多少显存7️⃣FP16/BF16 区别8️⃣介绍 gradient checkpoint9️⃣RougeL 计算方法1️⃣0️⃣代码：找数组第 k 大元素✴️如果想了解更多算法相关的面试问题，欢迎后台咨询算法offer辅导。

查看10道真题和解析

点赞评论收藏

分享

2025-12-27 19:25

中南大学算法工程师

京东大模型算法一面-校招面经

1.项目拷打为主2.项目中的OCR怎么做的，为什么用大模型做3.后训练的数据规模有多少？数据集是自己构建的吗4.数据清洗采用了什么策略5.OCR如何处理复杂表格6.微调前后准确率对比7.Badcase有哪些，占比怎么样8.为什么用GRPO不用DPO9.什么任务适合DPO10.模型微调用的是全参微调还是lora微调，为什么这么选11.Lora微调的阿尔法和rank是怎么选择的，对模型的影响分别是怎么样的12.GRPO奖励怎么设计的13.是否做过消融实验14.讲讲react思想15.讲讲agent中的反思模块逻辑16.Agent中数据是怎么交互的

查看15道真题和解析

点赞评论收藏

分享

不愿透露姓名的神秘牛友

2025-12-23 10:00

大模型算法秋招offer求助

夸克，薪资 (n+1)*16+c签字费，暑期实习转正，主要做ai搜索业务的ra搜索引擎重构，为千问c端提供检索材料，包括召回 粗排 精排等流程。leader mentor都挺好，偏向业务。高德，薪资 n*16+(c+3)签字费，做agentic rl相关的技术研究，组里比较稳定，技术氛围较为浓厚，目前在技术探索迭代的阶段，还没有具体的业务应用场景。若技术成功，会用在本地生活相关的吃喝玩乐上。两者的年包都差不多，纠结在于高德招的人很多 且目前没有明确的agent应用场景，难以做出成果来晋升，去夸克的话担心之后错过了做技术的机会...

点赞评论收藏

分享

01-07 09:48

南方科技大学后端工程师

年前深圳的实习为什么这么难找

方向是后端开发，或者 agent偏开发方向。由于课题组的原因导致无法全国可飞，只能锁死在在深圳找日常实习，有没有友友知道为什么年前深圳的实习这么难找，感觉 hc 特别少，各大厂似乎都不怎么招人，怎么办，要等到年后再面吗？

点赞评论收藏

分享

评论

3

19

招聘动态

牛客网申助</br>备战春招大杀器

27届寒假/转正实习汇总

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 上班以后，你还有哪些坚持的爱好？ #

3439次浏览 100人参与

# 拼多多工作体验 #

42612次浏览 275人参与

# 你最近因为什么迷茫？ #

20946次浏览 290人参与

# 你有哪些缓解焦虑的方法？ #

47454次浏览 892人参与

# 你都在哪些场所面过试？ #

8653次浏览 137人参与

# 记录实习开销 #

176681次浏览 677人参与

# 当你面对裁员会如何？ #

355885次浏览 2878人参与

# 你认为小厂实习有用吗？ #

114881次浏览 677人参与

# 实习离职怎么跟领导说 #

74757次浏览 412人参与

# 工作一周年分享 #

49238次浏览 243人参与

# AI coding的好用工具分享 #

8599次浏览 194人参与

# 工作压力大怎么缓解 #

133421次浏览 1163人参与

# 实习怎么做才有更好的产出 #

5432次浏览 128人参与

# 一起聊字节 #

241352次浏览 1018人参与

# 实习生工资多少才算正常？ #

6786次浏览 128人参与

# 找工作以来，你最看不惯__ #

5228次浏览 136人参与

# 你给AI提过哪些离谱的需求？ #

3037次浏览 107人参与

# 26届秋招投递记录 #

112216次浏览 661人参与

# 领导做过最不靠谱的事 #

7011次浏览 131人参与

# 上班到公司第一件事做什么？ #

134394次浏览 938人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务