2025-11-02 06:10 门头沟学院 Java

关注

美团大模型二面面经

1.详细说一下dns解析它是怎么解析的，过程咋样
2.Transformer你给我讲讲它底层原理，讲一下它为啥能替代RNN，我们知道Transformer架构已经很成熟了，但你觉得它的Self-Attention机制在多模态对齐上会不会存在瓶颈？有没有实际场景里注意力权重完全偏掉的情况
3.说下LoRA的原理吧，LoRA是不是只能在Linear层插？你有没有了解过为什么不能插在LayerNorm之后？这会对训练稳定性造成什么影响
4.你刚才提到用过QLoRA，那你能具体说说QLoRA是怎么降低资源成本的吗？常见的量化方式有哪些，QLoRA为什么选的是NF4和FP16这组组合，而不是别的组合？你能说说NF4 的分布拟合逻辑吗
5.我们做了一些multi-query attention优化，但发现decoder延迟还是高，你觉得是哪里的瓶颈vLLM 本身的KV cache 是不是反而是负担
7. Embedding模型和Rerank模型分别是怎么处理文本语料的？用场景举一下例子
8.看你做过RAG，讲讲从数据清洗到检索服务上线这整个链路是怎么搭的，你是怎么做chunk切分的
10.你觉得当前RAG的最大瓶颈在哪？你做过哪些改进来提升 Recall
11.你们在训练xx领域大模型的时候，SFT 数据怎么构造
12.看你做过LoRA微调，那你是怎么选rank值的？合并adapter权重的时候有没有遇到梯度爆炸
13.我看你这个特长里面也有写过使用这个模型部署是吧你也做过相关模型部署的工作，那咱们能简要的说一下，我们部署的参数量模型部署的参数量，然后还有它对应的硬件之间的需求关系，比如说我每个参数量的模型所需要的算力需求大概是什么？先给出一个题吧，我们部署一个MOE架构的千分三的235b的一个模型，他所需要的算力大概是多少？
14. 比如rag知识库搭建就是比如说我们在搭建这个知识库的时候，需要对这个知识库的文件文档进行动态更新了，那么你之前是用的是全量嵌入还是增量处理？如果是用增量的话，那么怎么来避免新旧文档的文单的分布不一致导致的这种检索偏差的问题
15.你那个机械臂的那个动作态这一块融合的这一块，然后你那个具体的数据是怎么进行一个融合的，然后这个对比协议是怎么做的
16.在做多模态融合的时候，有没有做过过视觉跟文本之间的对齐任务，怎么做的

全部评论

推荐最新楼层

沉迷学习201909171255975

门头沟学院自然语言处理

兄弟想求一下大模型面试题，或者帮忙给指条路去哪里总结

点赞回复分享

发布于 2025-11-12 17:39 北京

当时明月无

安徽省蚌埠第七中学 Java

大模型后台开发还是算法？

点赞回复分享

发布于 2025-11-03 11:21 天津

2025-12-26 20:41

哈尔滨工程大学深度学习

大模型日常实习offer求助

一个是百度文库的多模态AIGC算法，做文库的多模态内容生成方向；一个是荣耀的大模型算法工程师，偏向强化学习，做类似豆包手机的东西。楼主是第一次实习，不知道该怎么选希望看到的家人们来点意见

点赞评论收藏

分享

01-02 22:28

中山大学算法工程师

蚂蚁集团多模态大模型实习面经

📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

点赞评论收藏

分享

2025-12-20 07:20

中南大学算法工程师

淘天大模型算法实习二面

1.介绍自己的项目2.BLEU和ROUGE3.self-attention求内积时为啥除以根号d4.LLM的评估5.介绍下simCSE6.解决tokens不够的问题应该怎么办7.详细介绍下deepspeed（三个stage结合参数回答）8.gpt和llama的区别（模型结构上的）9.PEFT的方式，LORA论文讲一下，对比p-tuning10.LLM训练的时候为什么warmup11.对比学习中的batch size是大一些好还是小一些好13.了解最新技术一般怎么通过什么渠道14.代码题：lc347 前 K 个高频元素

点赞评论收藏

分享

2025-12-18 17:25

山东大学算法工程师

阿里实习大模型算法一面

1. Encoder与Decoder中注意力机制存在哪些差异？2. 注意力机制的计算流程是怎样的，为何在计算时要除以根号下Dk，掩码注意力机制又是怎样达成的？3. 阐述GQA、MQA、MLA的原理分别是什么。4. 位置编码的必要性体现在哪里，为何选用sin_cos函数进行位置编码？5. 询问之前实习中Agent的设计思路，以及所提创新方法的实现方式。6. 提及使用DeepSpeed开展SFT训练，请说明DeepSpeed ZeRO Stage 1 - 3的不同之处，以及何种情况下使用FSDP更为合适。7. 询问Agent工具的设计情况，是否采用workflow形式。8. 了解哪些Agent开发框架，像langchain和LlamaIndex，它们的核心应用场景有何区别？9. 针对数据输入输出格式，为保证大模型输出稳定json格式，采取了哪些措施？10. 若Agent推理API需要低延迟响应，会从哪些方面开展系统级优化工作？11. 代码考察：给出LeetCode第34题，在排序数组中查找元素的第一个和最后一个位置

点赞评论收藏

分享

2025-12-28 16:45

山东大学算法工程师

日常实习-百度大模型算法二面横向...

1.八股：DeepSeek-V3 和 Qwen2.5-Coder 在架构上有哪些关键区别？（如 MLA、MoE、GQA、Dense 等）2.八股：Transformer 中因果注意力（Causal Attention）和双向注意力的核心区别是什么？分别适用于什么场景？3.项目：如果 RAG 输出错误，怎么判断是检索错了还是生成错了？有做过归因实验吗？4.项目：Chunk划分策略对 RAG 效果影响大吗？你用过哪些优化方式（如语义分割、滑动窗口等）？5.项目：RAG 和 GraphRAG 在处理多跳推理时的根本区别是什么？6.项目：GraphRAG 如何解决传统 RAG 的“召回噪声”和“信息碎片”问题？7.项目：为什么 GraphRAG 能实现更精准的结构化召回？关键依赖是什么？8.项目：如果不用图数据库，能实现真正的 GraphRAG 吗？为什么？9.代码题：最长连续递增子序列（LeetCode 674）

查看9道真题和解析

点赞评论收藏

分享

评论

7

27

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26年哪些行业会变好/更差 #

13549次浏览 179人参与

# 卷__卷不过你们，只能卷__了 #

6811次浏览 159人参与

# MiniMax求职进展汇总 #

221次浏览 4人参与

# 去年的flag与今年的小目标 #

6520次浏览 155人参与

# 哪些公司在招寒假实习？ #

7053次浏览 84人参与

# 有深度的简历长什么样？ #

12433次浏览 262人参与

# 机械人的秋招小目标 #

25792次浏览 226人参与

# 现在前端的就业环境真的很差吗 #

488028次浏览 5884人参与

# 写论文的崩溃时刻 #

3406次浏览 100人参与

# 入职第一天 #

7614次浏览 149人参与

# 你不能接受的企业文化有哪些 #

7271次浏览 123人参与

# 央国企投递记录 #

170083次浏览 1633人参与

# 腾讯音乐求职进展汇总 #

146986次浏览 1042人参与

# 你都用AI做什么 #

4761次浏览 112人参与

# 实习教会我的事 #

48553次浏览 359人参与

# 一人分享一道面试手撕题 #

16406次浏览 671人参与

# 秋招白月光 #

645630次浏览 5011人参与

# 一人一道大厂面试题 #

112044次浏览 1253人参与

# 应届生应该先就业还是先择业 #

163333次浏览 828人参与

# 实习，不懂就问 #

148572次浏览 1337人参与

# 新凯来求职进展汇总 #

67103次浏览 174人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务