算法打工人小旺 - 个人主页动态 - 牛客网

发布(32) 评论刷题收藏

昨天 22:29

中山大学算法工程师

阿里大模型面经汇总

1.  注意力机制：请简述 MHA、MQA 和 GQA 三种注意力机制的核心区别。2.  模型架构：Dense 模型与 MoE 模型有何本质区别？3.  路由机制：MoE 模型中，路由（Routing）机制具体是如何工作的？4.  LoRA 微调：请阐述 LoRA 的原理，以及其中 A、B 矩阵的初始化方式和秩（Rank）的设置考量。5.  强化学习：请对比 DPO、PPO 和 GRPO 的原理与区别，并写出 DPO 的 Loss 函数公式。6.  推理加速：vLLM 中使用了哪些关键技术（如 PagedAttention、KV Cache）来优化推理？7.  并行框架：你对 DeepSpeed 这一加速推理与训练框架有多少了解？8.  BM25 算法：请讲解 BM25 算法的计算原理。9.  负载均衡：MoE 模型中专家（Expert）的负载不均衡问题该如何解决？10.  损失函数：能否通过修改损失函数的方式来缓解 MoE 的负载均衡问题？11.  数据分布：SFT 微调数据与预训练数据分布差异较大时，该如何处理？12. Scaling Law：SFT 微调的数据集是越大越好吗？是否存在 Scaling Law 现象？13. 训练稳定性：强化学习（RL）为何存在训练不稳定的问题？既然不稳定为何业界仍广泛使用？14. 三数之和：LeetCode 15. 三数之和。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看14道真题和解析

0 点赞评论收藏

分享

昨天 08:33

中山大学算法工程师

美团大模型推荐算法面经

📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

0 点赞评论收藏

分享

12-08 22:31

中山大学算法工程师

小红书社区搜索算法实习面经

1.项目拷打2.谈谈传统搜索算法和RAG的理解3.了解ReAct架构吗4.介绍一下self attention吧5.介绍一下MHA6.了解KV缓存吗7.了解MHA的变体吗8.了解MLA吗为什么大模型结合RAG会出现AI幻觉的现象？你怎么看？怎么解决？9.了解PE优化吗10.了解dpo和PPO吗11.开放场景:如果你有一个待优化的模型和一堆query，你怎么利用PPO来优化模型？📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看10道真题和解析

0 点赞评论收藏

分享

12-08 17:36

中山大学算法工程师

小米 AI 大模型面试

1.自我介绍＆项目深挖2.针对 RAG 项目3.使用的 Embedding 模型结构是什么？输出向量维度是多少？4. Transformer 更新哪些参数？5.如何缓解大模型的幻觉问题？6.请描述 Transformer 的基本结构，并解释自注意力机制。7.输入向量的维度是多少？8.LayerNorm 是对哪个维度做归一化？9.你了解哪些微调方式？10.如何优化大模型的训练和推理效率？11.Prompt Tuning 和 P - Tuning 的区别是什么？12.如何让大模型处理更长的文本？13.代码能力考察:请手写反转链表。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看11道真题和解析

0 点赞评论收藏

分享

08-19 23:53

中山大学算法工程师

算法岗薪资你了解嘛

算法岗薪资你了解嘛今天给大家分享一下，作为一种高效的算法岗学习路线，通过项目辅导或者保拿offer辅导的同学拿到算法岗offer的薪资有多少。我们是面向大模型，搜广推，多模态大模型等热门的算法方向提供指导。💥首先讲结论，绝大部分校招应届生拿到算法岗offer的薪资范围在40-60w，薪资总包超过50w认为是小SP，如果能达到60w以及以上可以认为是SP/SSP。💥社招，表现优秀的或者转行算法岗的同学，薪资涨幅可以达到40-50%，少部分可以实现翻倍的涨幅。✅同学A：校招，985本海外硕，非科班，参加多个项目辅导，收获快手，拼多多，虾皮，华为等公司LLM算法offer，总包最高70w。✅同学B：校招，海本海硕，参加保拿offer辅导，收获美团，快手，拼多多，新浪等公司LLM算法offer，总包最高60w+。✅同学C：校招，211本985硕，参加多模态和AIGC项目辅导，收获阿里国际和京东LLM算法offer，总包接近50w。✅同学D：校招，985本硕，参加保拿offer辅导，收获蚂蚁和小米多模态大模型算法offer，总包最高50w+。✅同学E：校招，双非本985硕，参加多模态项目辅导，收获爱奇艺多模态理解算法offer，总包45w。✅同学F：校招，双非本985硕，参加搜推算法项目辅导，收获美团搜推算法offer，总包60w。✅同学G：校招，211本985硕，参加搜推算法项目辅导，收获美团运筹算法，京东风控算法，总包最高60w。✅同学H：校招，211本985硕，参加搜推算法项目辅导，收获得物机器学习算法和360广告算法offer，总包最高60w。✅同学L：校招，双非本211硕，参加多个项目辅导，收获小米大模型应用开发offer，薪资总包40w。✅同学I：社招，985本硕，工作一年，参加多模态项目辅导，收获字节抖音内容安全的多模态大模型内容理解算法offer，薪资涨幅40%。✅同学J：社招，工作三年，海硕，非科班转行算法，参加保拿offer辅导，收获多家AI独角兽大模型算法offer，薪资涨幅最高100%。✅同学K：社招，工作三年，双非本海硕，CV转行大模型，参加保拿offer辅导，收获百度和国企大模型算法offer，薪资涨幅最高50%以上。✴️如果同学想免费规划算法岗学习路线以及了解项目辅导的具体信息，欢迎后台咨询，支持大模型/多模态/搜广推/AIGC等热门方向。互联网大厂  人工智能就业 #

0 点赞评论收藏

分享

08-18 22:46

中山大学算法工程师

算法岗薪资能拿多少

✴️今天给大家分享一下，作为一种高效的算法岗学习路线，通过项目辅导或者保拿offer辅导的同学拿到算法岗offer的薪资有多少。我们是面向大模型，搜广推，多模态大模型等热门的算法方向提供指导。💥首先讲结论，绝大部分校招应届生拿到算法岗offer的薪资范围在40-60w，薪资总包超过50w认为是小SP，如果能达到60w以及以上可以认为是SP/SSP。💥社招，表现优秀的或者转行算法岗的同学，薪资涨幅可以达到40-50%，少部分可以实现翻倍的涨幅。1️⃣同学A：校招，985本海外硕，非科班，参加多个项目辅导，收获快手，拼多多，虾皮，华为等公司LLM算法offer，总包最高70w。2️⃣同学B：校招，海本海硕，参加保拿offer辅导，收获美团，快手，拼多多，新浪等公司LLM算法offer，总包最高60w+。3️⃣同学C：校招，211本985硕，参加多模态和AIGC项目辅导，收获阿里国际和京东LLM算法offer，总包接近50w。4️⃣同学D：校招，985本硕，参加保拿offer辅导，收获蚂蚁和小米多模态大模型算法offer，总包最高50w+。5️⃣同学E：校招，双非本985硕，参加多模态项目辅导，收获爱奇艺多模态理解算法offer，总包45w。6️⃣同学F：校招，双非本985硕，参加搜推算法项目辅导，收获美团搜推算法offer，总包60w。7️⃣同学G：校招，211本985硕，参加搜推算法项目辅导，收获美团运筹算法，京东风控算法，总包最高60w。8️⃣同学H：校招，211本985硕，参加搜推算法项目辅导，收获得物机器学习算法和360广告算法offer，总包最高60w。9️⃣同学L：校招，双非本211硕，参加多个项目辅导，收获小米大模型应用开发offer，薪资总包40w。1️⃣0️⃣同学I：社招，985本硕，工作一年，参加多模态项目辅导，收获字节抖音内容安全的多模态大模型内容理解算法offer，薪资涨幅40%。1️⃣1️⃣同学J：社招，工作三年，海硕，非科班转行算法，参加保拿offer辅导，收获多家AI独角兽大模型算法offer，薪资涨幅最高100%。1️⃣2️⃣同学K：社招，工作三年，双非本海硕，CV转行大模型，参加保拿offer辅导，收获百度和国企大模型算法offer，薪资涨幅最高50%以上。🌟如果同学想免费规划算法岗学习路线以及了解项目辅导的具体信息，欢迎后台咨询，支持大模型/多模态/搜广推/AIGC等热门方向。

0 点赞评论收藏

分享

08-16 22:52

中山大学算法工程师

面试官:Qwen3 Rerank 有什么改进？

1️⃣重排序方法1.Point- wise ：将每个文档与查询的相关性独立建模，转化为二分类或回归问题，不直接考虑文档间的顺序关系2. Pair - wise ：判断文档 A 是否比文档 B 更相关，通过优化文档对的顺序正确性来实现排序3.List- wise ：输入整个文档列表，直接优化排序指标，考虑文档在列表中的位置权重Qwen3 Rerank 基于Qwen3推理大语模型，使用 point - wise 方法将每个候选项与查询进行单独评估。2️⃣Qwen3 Rerank 数据合成Qwen3 Rerank 模型加入信息检索、比对挖掘、分类和文本相似度四类合成数据。以信息检索为例1.输入：多语种文档＋候选角色2.Qwen3-32B决策：选择最可能对文档感兴趣的角色、问题类型与难度（高中／大学的知识）3.构造检索对：输入上一阶段的文档与角色，对问题类型、难度进行限制。从角色视角出发，按需求生成文档对应的自然语言查询。4.高质量数据：对每一对数据计算 cosine 相似度，选择相似度大于0.7的数据作为高质量数据。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

0 点赞评论收藏

分享

08-15 12:16

中山大学算法工程师

滴滴大模型三面总结

1️⃣一面 1. Self-Attention的原理2. LLM 编码器和解码器的特点3. 常用的开源大模型4. 都做过什么技术（罗列，没有深挖）5. 对强化学习的了解手撕一道力扣简单反问组里做什么工作2️⃣二面1. 让挑一个自己最拿手的项目介绍2. 数据蒸馏的方法3. 实践过程中有什么值得注意的点4. QWEN2的架构和训练方式5. PPO DPO GRPO的区别，几个强化学习的损失函数6. 自监督学习怎么做无手撕，简单反问3️⃣三面1. 如何防止毁灭性遗忘2. 大模型如果应用到具体场景3. 现在大模型应用的主流范式4. 为什么用GRPO而不是SFT5. 一道数学题📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

0 点赞评论收藏

分享

08-14 23:28

中山大学算法工程师

面试官:关于Rag，你了解多少？

1️⃣面试官：上面这个是 RAG 标准流程，实际项目中还有哪些优化技巧？在实际中，召回源会考虑多路召回，例如稀疏召回，语义召回，字面召回等。对于多路召回截断和召回分数对齐的问题，还会采用在召回后面增加一个重排序的阶段，精简召回数并提升召回的质量。另外，其中的 embedding 模型，重排序模型，以及生成模型会根据系统问答的指标情况，会针对性的进行进一步的微调。2️⃣面试官：那生成环节怎么评估效果？首先是量化指标：例如 Rouge - L ，文本相似度，关键词重合度等指标。除了准确度，还可以评估生成答案的多样性，看看模型是否能够生成多种合理且相关的答案。还需要引入人类评估：进行人工评估，一般是负责改项目的产品经理和测试人员，以及内测的普通用户对模型的回答进行质量、准确性和连贯性的评分。还应考虑资源效率：考虑模型的计算复杂性、内存需求和推理速度，尤其是在资源受限的环境中，看看 RAG 是否能够以合理硬件资源效果提供更好的性能。3️⃣面试官： RAG 中为什么会出现幻觉？幻觉问题是大模型的一个通病，出现幻觉问题主要分为两大类，一类是生成结果与数据源不一致，自相矛盾。另一类是用户问题超出了大模型的认知。针对前者可能是训练数据和源数据不一致、数据没对齐或者编码器理解能力的缺陷和解码器策略错误可能导致幻觉。后者则是用户的问题不在语言模型认知范围内。4️⃣面试官：针对幻觉的问题，有什么解决思路？第一个是引入更精准的知识库，消除虚假的数据源，减少数据偏差。另外可以加入一些纠偏规则，比如采用 ReAct 的思想，让大模型对输出的结果进行反思；还有现在比较流行的思路是集成知识图谱，即不再局限于向量数据库匹配，做召回时不仅考虑文档块，同时还考虑图谱的三元组。将知识图谱( KGs ）集成到 RAG 中，通过利用知识图谱中结构化且相互关联的数据，可以增强当前 RAG 系统的推理能力。5️⃣面试官：在实际做项目中，经常遇到各种边界的 case ，一般怎么解决？首先是无效问题：如果对于知识库中没有的问题，我们需要做一个准入的判别，判断是否需要回答。一般是一个二分类模型，或者直接用大模型+ prompt 来做，使模型在这种情况下输出一个预设的兜底话术。第二是减少幻觉：对于时间变化的问题，模型回答&quot;我不知道&quot;。在推理模块中添加规则和提示工程技术，使模在不确定时回答&quot;根据当前的信息，不足以回答这个问题&quot;。还有格式错误：模型可能会生成无法解析的答案，例如没有输出预定义格式。

0 点赞评论收藏

分享

08-13 11:50

中山大学算法工程师

面试官:讲讲RRF在RAG系统的应用!

✅ 什么是RRF(Reciprocal Rank Fusion)❓一种排名融合方法，将多个检索器的结果合并成一个统一的排名。✅ RRF的作用❓不同的检索器可能会有不同的优势和不足，通过RRF可以结合它们的长处，提供更精准的结果。✅ RRF的具体流程❓RRF使用一个公式来计算每个文档的总得分，RRF(d) = sum { 1 / ( k + r ( d ) ) } ，这里 d 是文档，R 是检索器的集合，k 是一个常数，通常取60，r(d) 是文档在某个检索器中的排名。✅ 这个公式是如何做排名的❓使用了倒数排名（Reciprocal Rank），也就是( 1 / ( rank + k ) )这样排名越高的文档贡献的得分越大，这可以确保多个检索器共同认为重要的文档在最终排名中占据优先位置。同时随着排名的增加，贡献得分的增速会减缓，也就是说，排名1和排名2之间的差异，比排名100和101之间的差异更显著。另外，常数k起到了平滑因子的作用，防止单个检索器对结果的主导性太强，还能更好地处理排名相近的文档。✅ 具体讲讲RRF在RAG系统中的实际应用流程❓RRF在RAG系统中的应用可以分为几个步骤：1️⃣用户输入查询，系统开始处理。2️⃣查询被发送到多个检索器，这些检索器可以是不同的检索模型，比如密集型、稀疏型或者混合型。3️⃣每个检索器生成自己的相关文档排名。4️⃣使用RRF公式将所有检索器的排名结合起来，计算每个文档的总得分。5️⃣根据RRF得分生成最终的统一排名。6️⃣最后，生成模型使用排名靠前的文档来生成最终的答案。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

0 点赞评论收藏

分享

08-12 13:55

中山大学算法工程师

小红书NLP算法面经一面

✅项目:问的很细，基本有半小时，需要充分准备！✅八股1. 最新强化学习技术了解什么？2. Deepseek GRPO，讲讲原理和之后的改进3. DPO训练原理4. MOE架构原理5. Qwen3的技术原理6. 了解最新技术一般怎么通过什么渠道7. RAG遇到模型缺失电商知识一般怎么做✅代码：三数之和总结：感觉面试官很注重项目，挖的很深还边面边敲字做笔记，但是总体没有刁难我，题卡顿了一会儿，最后也做出来了，面完半小时就约二面了✌📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看8道真题和解析

0 点赞评论收藏

分享

08-11 12:04

中山大学算法工程师

腾讯混元多模态一面

1️⃣自我介绍2️⃣实习项目拷打3️⃣科研拷打4️⃣八股Grpo 原理，公式，与 ppo 的区别1.介绍其他的一些强化学习方法2.介绍 Rope3.为什么大模型用 decode - only 架构，为什么不用 encode - decode4.介绍 qwen -2.5的结构5.Sft 训练 qwen - vl -7b模型占用的显存是多少，vit 和映射层占多少显存6.训练的时候爆显存了怎么解决7.介绍一下 deepspeed5️⃣手撕1.连续数组最大和2.搜索旋转数组📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看13道真题和解析

0 点赞评论收藏

分享

08-10 09:27

中山大学算法工程师

百度提前批一面：说下grpo训练loss怎么算

1.自我介绍1min2.项目介绍，提到了grpo训练3.说一下grpo的原理以及loss计算（从策略梯度公式推导开始讲，以及grpo的组间reward怎么算的）4.为什么需要加上kl约束（防止更新不稳定，探索太远了）5.grpo的kl是怎么计算的（记得是k3-kl）6.那如果你训练中大量出现全对全错的样本怎么办（直接丢弃？）7.如果全部丢弃，会带来什么问题？（我说有论文表示丢弃没啥问题hhh）8.面试官摇头，我说那要不再多rollout几个样本9.怎么多rollout几个？你算一下如果是8张A100训练7B的模型，grpo可以rollout几个样本不炸显存？10.coding torch写一下grpo的loss吧📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看10道真题和解析

0 点赞评论收藏

分享

08-09 13:30

中山大学算法工程师

快手．大模型应用一二面

🍓一面时长约50min，面试官很和蔼，体验感还不错。1．面试官先简单介绍了下团队，然后是自我介绍；2．拷打了一下项目和论文；3．为什么多头注意力能提升表达能力？4．为什么要在大模型中使用 RMSNorm ？和 LayerNorm 有什么差异？5.LoRA和 PromptTuning 有何区别，分别适用于什么场景？6．模型微调时遇到过过拟合吗？怎么处理的？7．大模型推理时的加速思路？8.KV Cache 是怎么起作用的？为什么对长上下文推理很关键？算法题手撕：字符串的全排列。二叉树序列化与反序列化。✅面试感受：整体提问节奏比较平稳，面试官很有亲和力，有的地方卡住了还会给提示。🍓二面时长约40min，主要是针对简历进行深挖。1．自我介绍。2．深挖项目，针对项目思路不断追问。3．大模型生成内容如何做去重过滤？4．如果词表特别大（10w+ token ), Softmax 加速通常有哪些实现？5．如果要在中文领域做 Instruction Tuning ，需要注意哪些数据问题？6．反问✅面试感受：二面的氛围和一面截然不同，面试官提问非常犀利，没有太多套路问题，并且对细节很关注。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看13道真题和解析

0 点赞评论收藏

分享

08-08 12:15

中山大学算法工程师

腾讯大模型搜索算法岗社招一面

1️⃣RAG部分1.讲一下RAG的总体流程？—结合项目2️⃣Query 理解2.用户理解阶段一般会做哪些处理？有何作用？可以做哪些优化？3️⃣Index 构建3.文档问答中，如何构建索引，提升对用户问题的泛化能力？4️⃣Retrieval 召回4.多路检索如何实现？如何合并多路检索的结果，对它们做排序？5️⃣Reranker 精排5.如何构建重排序模型的微调数据？6️⃣模型结构部分6.RoPE相对正弦位置编码有哪些优势？7.为何使用 RMSNorm 代替 LayerNorm？8.RMSNorm与LayerNorm在数学公式上的核心区别是什么？7️⃣微调部分9.指令微调（Instruct-tuning） 和 提示学习（Prompting）的区别是什么？10.LoRA的工作原理及其优势？11.为什么在参数高效微调中使用低秩矩阵分解？

查看11道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务