算法打工人 - 个人主页动态 - 牛客网

发布(27) 评论刷题收藏

04-29 22:33

中山大学算法工程师

阿里淘天 AI Agent应用开发二面面经

一、自我介绍二、项目深度拷问一（多模态相关项目）1. 项目中针对图文模态对齐问题，具体采用了哪些技术方案解决？2. 若图纸类视觉内容在文本中无任何对应描述，模型如何依托视觉特征实现精准内容召回？3. 项目向量数据库Milvus中，选用了哪类索引算法，选择该算法的核心依据是什么？4. 针对专业术语出现语义偏移的问题，除了混合检索方案，是否尝试过Embedding模型微调、Adapter适配等优化方式？具体落地思路是怎样的？三、项目深度拷问二（Agent对话/画像项目）1. 当外部测评工具返回的原始数据格式，与大模型输入预期格式不匹配时，如何实现数据格式的自动化映射？2. 向量库检索出的用户长期画像数据，与当前实时会话状态产生冲突时，整套系统的处理逻辑和解决方案是什么？3. 如何避免模型回复过度依赖检索到的外部知识，导致回答生硬、缺乏共情能力，提升对话自然度？四、AI Agent核心技术原理1. 对比思维链（CoT），ReAct范式在模型与外部环境交互过程中，核心解决了哪些痛点问题？2. 详细阐述大模型实现函数调用（Function Call）的完整流程，模型是如何将自然语言语义转化为标准化结构化参数的？3. 实际开发过程中，如何判断一个任务适合采用固定Workflow流程，还是自主决策型Agent来实现？五、Agent记忆与检索优化1. 详细讲解Agent系统中长短期记忆的设计逻辑，在长时对话场景下，如何实现上下文信息的动态压缩与选择性遗忘？2. 在Agent系统架构中，RAG检索获取的外部知识，是如何精准输入给模型，同时避免无关知识对模型输出产生干扰的？3. 解释重排序（Rerank）技术的定义，它在Agent检索链路中，对提升模型最终决策准确性起到哪些关键作用？六、多Agent与人机协作1. 单Agent处理复杂长周期任务时，引入多智能体（Multi Agent）架构的核心优势有哪些？2. Multi Agent系统中的路由（Router）节点，依据哪些规则和逻辑，将任务分发给对应的子Agent？3. 什么是人在回路（Human-in-the-loop）机制？在Agent系统开发中，如何合理设计人工审批断点，保障系统运行可靠性？七、系统评估与性能优化1. 有哪些量化评估方式，可以衡量一套Agent系统的优劣？2. 除模型生成质量外，Agent系统还需要重点关注哪些维度的评估指标？3. 针对Agent多步推理过程中产生的响应延迟问题，可落地的优化方法有哪些？4. 随着大模型上下文窗口持续扩容，传统RAG技术是否会被完全替代？阐述你的核心观点及理由。

查看20道真题和解析

0 点赞评论收藏

分享

04-28 22:06

中山大学算法工程师

阿里淘天AI应用开发一面

1.请做一段简单的自我介绍。2.做多模态Embedding任务时，如何平衡文本语义与图像视觉特征的相似度计算权重，若用户检索图纸特定参数却召回大量外观相似零件图，问题根源是什么，同时Ragas指标中Context Precision过低该如何优化？3.你的向量记忆库采用何种去重方案，用户重复表述同一内容时会重复存储还是语义合并，基于MCP接入多测评工具且同问题返回格式不统一时该如何处理？4.面对用户模糊含糊的提问，Agent会直接检索知识库还是先反问用户确认需求？5.当Agent调用工具出现报错时，该怎样设计提示词引导模型利用报错信息自主重试，而非直接将错误返回给用户？6.长对话上下文处理中，除文本截断外，请列举并说明多种更高效的上下文压缩方案。7.多Agent系统中，依靠LLM充当路由分发任务与依靠固定规则分发任务，二者分别具备哪些优势与劣势？8.基于Milvus数据库，如何完成BM25检索与向量检索的分数归一对齐操作？9.需要限定检索某一时间节点之后的数据时，向量数据库该如何高效实现标量条件过滤？10.是否了解LoRA微调技术，训练LoRA过程中两个核心参数矩阵分别采用怎样的初始化方式？11.请详细阐述QLoRA算法的核心设计思想与关键原理。12.针对逻辑推理类任务做LoRA微调，对比普通对话任务，LoRA秩的取值应该偏大还是偏小并说明原因？13.模型推理部署阶段，为消除LoRA分支带来的推理额外延迟，是否会执行权重Merge操作？14.垂直领域指令微调后模型通用能力出现退化下降，有哪些可行的解决与改善办法？16.对比PPO算法，DPO训练无需在线采样生成回答的核心原因是什么，标准DPO训练的数据格式包含哪些内容？17.高并发场景下同时调用10个不同Embedding接口，asyncio.gather相较于多线程方案在系统资源消耗层面具备哪些具体优势？18.请手写代码实现合并K个升序链表的算法题解法。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看17道真题和解析

0 点赞评论收藏

分享

04-14 22:26

中山大学算法工程师

腾讯WXG推荐算法二面面经

1.自我介绍2.项目拷打3.为什么这种架构可以提升 MFU ?4.超长序列建模具体怎么做的？这种方案的区别和优势在哪里？信息被压缩的程度有什么不同？5.假如你要引入向量索引系统，在线 serving 服务要做什么改造？6.样本和线上实时特征如何保持一致？7.OneTrans 把序列和非序列特征放在一起组织，不同行为特征是怎么组织的？8.OneTrans 的金字塔结构具体怎么做？为什么要这么设计？9.attention 机制为什么随着序列变长耗时增加很快？时间复杂度是什么关系？10.如果要优化性能，做什么样的优化？11.多任务学习中的负迁移／跷跷板问题怎么解决？12.特征重要性是怎么评估的？13.除了 mask 特征的方式，还有什么方案可以建模特征重要性？14.如果通过特征加 gate 的方式学习特征重要性，你会怎么设计？15.手撕代码：两两反转链表16.反问环节📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看15道真题和解析

0 点赞评论收藏

分享

2025-09-17 23:33

中山大学算法工程师

SFG 框架的 “Encoder-Decoder” 核心设计

📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

0 点赞评论收藏

分享

2025-09-16 23:04

中山大学算法工程师

Qwen 模型每个版本之间的改进点

1️⃣Qwen1 模型训练使用FlashAttention 进行加速优化使用 AdamW 优化器进行BF16 混合精度训练训练时上下文长度为 2048，经过 NTK 插值法将上下文长度外推到 81922️⃣Qwen1.5 模型结构改进引入GQA，但只有 3️⃣Qwen1.5-32B 使用了GQA加入 MoE（14B-A2.7B）系列模型，使用4个共享专家与60个细粒度专家，每次推理激活4个专家网络4️⃣Qwen2 模型结构改进全系列使用 GQA，KV 缓存减少40%使用 YaRN+DCA（双块注意力机制）5️⃣Qwen2.5 模型尺寸共有0.5B、1.5B、3B、7B、14B、32B、72B这7种尺寸6️⃣Qwen3 模型训练1.预训练：数据规模从 18T tokens 拓展至 36T tokens。2.后训练：先使用CoT冷启动微调；再使用 GRPO 对query-verifier 数据集进行强化推理。3.数据蒸馏：用 KL 散度将对小模型与大模型对齐7️⃣Qwen3-2507模型结构改进将思考/非思考模型分开，不再使用一个模型进行切换。支持超长文本 256K📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

0 点赞评论收藏

分享

2025-09-15 22:21

中山大学算法工程师

大模型面经｜阿里一面

1.自我介绍和项目2.Qwen- VL 的训练流程是怎样的3.讲一下大模型的训练流程，多模态大模型的视觉特征传递给 LLM 都有哪些方法4.ViT 一般怎么预训练5.多模态 RAG 介绍一下6.对于不同形状的图片或视频，位置编码怎么设计7.在 ResNet 或者 Transformer 中，残差连接的作用是什么，展开讲讲8.开放题：大模型在训练和推理的时候显存不够，有哪些优化方法9.代码：215．数组中的第 K 个最大元素

查看9道真题和解析

0 点赞评论收藏

分享

2025-09-14 21:52

中山大学算法工程师

拼多多推荐算法岗二面

1.做了哪些工作2.AUC、AUUC、GAUC 的定义是什么3.新模型灰度测试指标不稳定，这时候负向如何理解4.模型经过离线哪些验证之后才上线的5. Transformer对比RNN、LSTM有什么不同6. .bes的数据有多少？大概扩充了多大的比例7.召回的两个塔是什么塔8.你怎么构建 ANN 索引的？ANN 的基本原理可以讲一下吗？普通负样本是什么？正负样本比例是多少？讲一下DIN？为什么用 softmax 会让效果变差9·多目标模型的优缺点10·了解 OneRec 吗11. 详细讲讲CrossNetwork的结构以及它的特别之处🏵️12. code :Ic206反转链表📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看12道真题和解析

0 点赞评论收藏

分享

2025-09-13 19:35

中山大学算法工程师

拼多多推荐算法一面

1.自我介绍2. RoBERTa做了哪些改进3.什么是ROI2？什么是增量推广4.怎么构建负样本的5. PLE之后的多任务模型还有了解吗6.指标对比baseline提升主要来自于什么7.模型拆分前后的结构变化8. MMOE、PLE的区别9. Uplift 模型长什么样？它的输入输出是什么10. AUC 算方法两种；写公式就行11.反问：组内工作📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看10道真题和解析

0 点赞评论收藏

分享

2025-09-11 23:19

中山大学算法工程师

26届校招|小红书NLP算法面经

一面 1. 怎么解决LLM幻觉问题2. DPO 训练的过程是怎么样的，正负概率怎么算3. MOE架构原理4. RAG如果有噪声怎么办5. 最新强化学习技术了解什么6. Deepseek GRPO，讲讲原理和之后的改进7. 召回索引怎么优化8. 意图识别LLM输出格式不好怎么优化🌟代码：三数之和🌟总结：面试官很看重项目部分二面1. RAG常用的检索方式2. 知道哪些Embedding模型3. 了解最新技术一般怎么通过什么渠道4. RAG遇到模型缺失电商知识一般怎么做5. Qwen3的技术原理6. 怎么防止客服LLM串台问题🌟代码：字符串解码🌟反问：组里的资源怎么样；具体业务📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看16道真题和解析

0 点赞评论收藏

分享

2025-09-10 23:48

中山大学算法工程师

字节广告算法面经

1.实习和论文2.机器学习八股3.交叉熵损失函数、 KL 散度4.损失函数每个簇的中心点怎么选推导5.Kmeans 参数6. 从数学角度分析L1、L2正则化区别7.Adam 优化器的原理8.交叉熵求导过程9.Dropout 训练和测试的差异10.手撕全连接层，实现 forward📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

今晚有星星：面个算法岗，差点以为在考数学系研究生

查看9道真题和解析

0 点赞评论收藏

分享

2025-09-09 23:45

中山大学算法工程师

突破推荐系统瓶颈：统一语义与ID表征学习框架全解析

1️⃣优化出发点推荐系统的发展始终围绕一个核心问题：如何精准理解用户偏好并匹配最相关的内容。✅冷启动困境：新加入系统的物品由于缺乏历史交互数据，其ID嵌入往往难以准确学习，导致推荐效果差。这与NLP中的未登录词(OOV)问题类似，严重限制了系统对新物品的推荐能力。✅泛化性不足：ID token难以捕捉相似物品间的共享特征，每个物品都被视为完全独立的实体，忽视了它们之间可能存在的语义关联。2️⃣模型架构:双token统一与距离度量创新的完美融合统一表征学习框架是一个精心设计的系统，主要由三个创新组件构成：统一的语义与ID tokenization策略、融合余弦相似度与欧氏距离的度量方法，以及端到端的联合优化机制。✅统一语义与ID tokenization:框架的核心思想是保留ID token的必要维度来表征物品独特属性，同时用语义token替代冗余维度来捕捉共享特征。✅统一距离度量:解耦与区分的层次化策略，论文的另一个关键贡献是对不同相似度度量在推荐系统中作用的深入分析。端到端联合优化：三重损失协同训练    为确保各组件协调工作，框架采用端到端训练方式，同时优化三个关键目标：推荐损失；RQ-VAE量化损失；文本重建损失。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

0 点赞评论收藏

分享

2025-09-08 23:12

中山大学算法工程师

字节推荐算法一面面经

一面 1.简历项目介绍2.如何做attention，为什么attention要除以根号dk?3.讲讲你对Embedding了解多少？4.对推荐系统都有哪些了解？常用技术点有哪些？5.从从ROC到AUC、再到GAUC，它们分别是什么，有什么区别？6.为什么Transformer选用LayerNorm而不是BatchNorm？7.如何进行模型的在线训练，和离线训练有什么区别？8.项目中涉及的模型是如何进行输出的，是否涉及在线预估？9.介绍多路召回策略。10.交叉熵怎么理解？11.算法题：三数之和

查看11道真题和解析

0 点赞评论收藏

分享

2025-09-07 22:40

中山大学算法工程师

26校招｜美团大模型面经

一  面 1.自我介绍，问实习和论文2.目前大模型模型结构都有哪些3.什么情况用Bert模型，什么情况用LLaMA、ChatGLM类大模型?4.prefix LM 和 causal LM、encoder-decoder 区别及各自有什么优缺点5.刚刚提到 MLA ，那 MLA 是怎么对 KV Cache 做优化的6.说一说大模型后训练的流程7.Qwen是怎么做长度外推的8.在 PPO 中，如何防止模型在微调数据集以外的问题上泛化能力下降？如何防止模型收敛到单一类型的高奖励回答9.代码：25.K个一组翻转链表二  面1.自我介绍和讲论文讲实习，多模态大模型是否有接触?落地案例?2.介绍一下 Qwen布的这几版模型，都做了哪些贡献，包括数据、模型和训练3.DeepSeek 有了解吗， DeepSeek 用到的 MLA 注意力是怎么做的？它可以直接用 RoPE 吗？为什么不能，它做了哪些优化4.了解大模型的解码策略吗，简要说一说吧5.现有一个能力较弱的多模态模型和一个能力较强的文本模型（如 DeepSeek-R1），如何结合两者的能力来回答与多模态相关的问题？6.代码：199．二叉树的右视图7.反问环节📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看14道真题和解析

0 点赞评论收藏

分享

2025-09-06 18:24

中山大学算法工程师

淘天大模型算法岗一面

1.生成模型用的什么，为什么这样选型，有没有对比过其他模型2.介绍检索做的优化，具体追问子问题分解怎么做，有没有做意图识别3.RAG怎么评估，指标有哪些4.介绍RAG项目5.怎么构建SFT数据集，数据量多少，微调方式是什么6.SFT数据问题不够多样化怎么办7.介绍一下function calling和MCP📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看7道真题和解析

0 点赞评论收藏

分享

2025-09-05 23:02

中山大学算法工程师

淘天大模型算法校招面经

1️⃣一面 1.自我介绍2.介绍一下项目，遇到的难点和解决的问题3.介绍Transformer，编码器和解码器的注意力有什么区别4.了解CLIP吗 ，介绍一下其他的对比学习方法5.说一下R1的训练过程6.BLIP 的三个损失函数分别是什么，数据是怎样清洗的7.BLIP2相对于 BLIP 有哪些改进，BLIP3又有哪些改进8.视觉编码器和 LLM 连接时，使用BLIP2中 Q - Former 那种复杂的 Adaptor 好还是 LLaVA 中简单的 MLP 好，说说各自的优缺点9.代码：买卖股票最佳时机2️⃣二面1.自我介绍和过项目2.Qwen- VL 的三个训练流程分别是什么，有什么作用介绍一下 CLIP3.后来有哪些比较经典的基于 Transformer 的语言模型， Qwen 相比于原始 Transformer 有哪些结构上的改动4.了解 RLHF 吗， DPO 和 PPO 有什么区别， Loss 是什么样的，各自的优缺点是什么5.了解哪些多模态大模型，简要介绍几个6.了解 LoRA 吗， LoRA 微调的原理是什么7.对PPO DPO GRPO计算逻辑的理解8.代码：实现多头自注意力3️⃣三面1.自我介绍和实习经历介绍2.GNN与LLM结合理解3.场景题：涉及偏好对话模型4.反问：岗位职责和未来规划📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看21道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务