算法打工人阿旺 level
获赞
326
粉丝
370
关注
0
看过 TA
2342
中山大学
2026
算法工程师
IP属地:山东
高级算法工程师,多模态/大模型/搜广推方向辅导
私信
关注
一、自我介绍二、实习相关八股1. 实习业务场景负责大模型对话对齐、指令微调、强化学习优化,提升模型生成准确性、合规性与指令遵循度,落地垂类对话/问答业务。2. SFT数据筛选、采样及处理3. 选择GRPO的原因、优化目标及数学原理- 选型原因:相比PPO显存占用低、无需价值网络、训练更稳定,对齐效率高- 优化目标:最大化模型生成优势,约束KL散度防止策略突变- 原理:分组优势归一化、截断策略比率、近端约束,降低训练方差4. 奖励函数设计(重点)围绕有用性、准确性、合规性、流畅性设计,分维度打分;加入KL惩罚,避免单一奖励过拟合,区分正负奖励权重。5. 判断RL训练质量达标方法- 奖励值收敛、KL散度稳定;- 离线评测:指令遵循率、幻觉率达标;- 人工抽检生成内容,无退化、无套路化输出6. 是否遇到Reward Hacking遇到过,模型生成空洞话术、固定模板刻意刷高奖励值。7. 其他奖励作弊类型刻意迎合奖励规则、答非所问、重复安全话术、回避核心问题、策略坍缩同质化输出。8. PPO和DPO了解- PPO:在线强化学习,近端策略优化,带价值网络,训练复杂度高- DPO:离线偏好优化,基于成对偏好数据,无需交互采样,训练简单稳定三、基础八股1. Attention计算时间复杂度标准自注意力:O(n²d)(n为序列长度,d为特征维度)2. KV Cache原理推理时缓存历史token的KV矩阵,避免重复计算,降低算力开销,提升推理速度。3. GQA、MLA原理- GQA:分组查询注意力,Q分组共享KV,平衡推理速度与效果- MLA:融合局部+全局注意力,适配长上下文,降低显存占用4. vLLM原理基于PagedAttention分页管理KV Cache,提升显存利用率,支持高并发推理。5. Flash Attention原理分块计算注意力,优化显存IO,减少HBM访问,提速同时降低显存开销。6. 稀疏注意力原理仅计算局部/关联token注意力,舍弃全局无关token,将复杂度降至O(n),适配长文本。7. 模型推理慢排查思路检查序列长度、batch大小;确认KV Cache、量化、FlashAttention开启;排查GPU显存、算子优化问题。四、编程题1. rand7()实现rand10()拒绝采样:rand7()*rand7()生成1-49数,保留1-40,映射为1-10,超出则重新生成。2. 浮点数组取整最小变化和贪心思路:每个数选上/下取整中差值更小的,累加最小总误差。3. 最长无重复子串
查看19道真题和解析
0 点赞 评论 收藏
分享
1. 挑选个人复杂度最高、难点最突出的项目完整讲解,重点说明项目核心痛点、落地难点、技术瓶颈与最终落地解决方案。2. 结合项目场景,说明Agent任务目标拆解逻辑,以及PPO算法完整训练指标、效果评估标准。3. 阐述RLHF对齐偏好定义逻辑,大模型对话优劣好坏的标注标准与偏好数据集构建逻辑。4. 详细讲解奖励模型RM、Critic网络结构设计思路,组件有效性验证方式、调优优化策略,以及整体对话效果量化评估方案。5. 对比选型SFT、DPO、PPO、GRPO、RAG多条技术路线,说明为何选用强化学习做Agent对齐优化,完整输出各方案评估维度、适配场景与选型依据。6. DPO全流程效果评估方式,结合实际业务案例说明DPO固有短板,对比DPO与GRPO原理差异、优劣特点与落地适用场景。7. 从算法原理角度,讲解GRPO具备更强探索能力、稳定训练的核心原因。8. 阐述个人参与RAG相关项目初衷,梳理RAG系统整体架构与核心工作内容。9. 对比语义切分、固定长度切分、递归语义切分优劣,说明递归切分选型原因,以及不规则、非结构化文档专属预处理方案。10. 梳理向量数据库选型核心考量维度,结合线上高并发、低延迟生产环境,说明落地选型策略。11. 说明关键词检索+向量检索混合检索设计原因,介绍召回率、准确率等检索效果客观量化评价指标。12. 针对检索召回不足、匹配精度偏低、上下文关联性差等问题,逐条梳理全链路优化手段。13. 讲解用户意图模糊、指代不清、需求不明确类问题的意图识别与澄清处理方案。14. 讲解重排序模型选型、技术实现、解决的检索冗余错乱问题,所用开源/商用工具库,以及不同重排模型横向对比实验结论。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看14道真题和解析
0 点赞 评论 收藏
分享
一、自我介绍请做一段简洁的个人技术自我介绍,重点介绍相关项目经历、核心技术栈与项目成果。二、项目相关技术提问一1. MinerU相较于传统OCR技术具备哪些核心优势?其版面解析准确率的提升,核心来源是什么?2. 在混合检索场景中,你是如何设置BM25检索与向量检索的融合权重的?3. 请详细讲解Ragas评测体系,以及你在项目中如何运用该工具完成效果评估。三、项目相关技术提问二1. 项目中选择使用LangGraph构建状态图的原因是什么?该框架相比其他方案有哪些适配点?2. 你在项目中如何定义Agent循环终止条件,以此避免其陷入逻辑死循环?3. 项目中的Agent安全护栏方案,采用的是关键词匹配策略,还是专门训练/调用的安全模型?如果调用模型,具体使用的是哪一款模型?四、Prompt工程相关提问1. 请分享你在项目中编写Prompt的通用思路、结构规范与优化技巧。2. 是否了解ToT(思维树)或GoT(思维图)技术?请对其核心原理、应用场景做简要讲解。五、Agent异常处理与记忆机制提问1. 若Agent工具调用出现超时、返回空值的异常情况,你会如何设计Prompt,让Agent向用户做出合理反馈?2. 请说明Agent架构中,短期记忆与长期记忆分别采用何种方式进行存储与管理?六、RAG技术深度提问1. 向量数据库已完成语义相似度计算,为何RAG流程中还需引入交叉编码器做二次重排?2. Rerank阶段的Top-k召回数量,你在项目中是如何确定的?3. 长文档处理时,切片粒度的选择依据是什么?你通常采用哪些切片策略?4. 如何评估Rerank模块的有效性?常用的评估指标有哪些?七、个人技术习惯提问平时是否有vibe coding的开发习惯?独立或参与完成过哪些技术项目?八、代码手撕完成一道基础算法编程题,题目难度适中,侧重基础逻辑与代码实现能力。九、反向提问📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看16道真题和解析
0 点赞 评论 收藏
分享
暑期实习 | 时长:约65分钟1. 个人基础情况介绍2. 实习经历深度追问3. 首个项目深挖:MinerU解析跨页表格时,保障表格语义完整的核心思路?简述Ragas评测框架;若Answer Relevance指标偏低,如何精准区分检索质量与模型能力的影响边界?4. 第二个项目深究:LangGraph中State的定义逻辑与流转机制?当任务节点数量较多时,如何规避状态对象膨胀引发的内存溢出问题?长期记忆库层面,多轮对话信息提炼为结构化用户画像并入库的具体实现路径?5. 文档切片策略:overlap参数的核心作用?如何权衡分片尺寸与上下文完整性之间的平衡关系?6. 对GraphRAG的理解与应用认知7. GraphRAG召回海量关联信息后,生成阶段如何借助自反思(Self-Reflection)或思维链(CoT)策略过滤检索噪声?8. ReAct框架的核心原理,阐述其对复杂任务理解能力的提升逻辑9. 模型调用工具出现参数幻觉、语法错误时,可采用的自动化修正手段有哪些?10. Multi-Agent系统中心化编排模式的内涵,对比点对点架构的核心优势11. Agent的Self-Reflection机制,说明其识别输出逻辑错误的底层原理12. Agent长期记忆的设计思路与核心要点13. 支付等高敏感操作场景下,Human-in-the-loop(人工介入)流程的设计原则与实现方式14. 单一Skill模块的设计思路与核心逻辑15. Skill与MCP的核心差异对比分析16. OpenClaw对Agent本地文件系统操作、代码执行环境感知及权限增强的实现逻辑17. 对Vibe Coding的理解,结合实际场景谈谈相关经验18. 如何保障自然语言任务描述能精准转化为稳定、可靠的执行路径?19. 上下文缓存的概念,说明其在处理Agent频繁读取的冗余系统指令时的核心价值20. 反向提问环节无算法手撕题📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看19道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务