AI Agent面经 5(持续更新)

Q1:规划和执⾏要不要拆开两个模型?

答案:视任务⽽定。Planner-Executor 拆分可提升可控性(强模型规划、快模型执⾏);单模型端到端更简单但易在⻓链路漂移。可混合:规划⽤强模型,执⾏层做确定性校验。

Q2:如何避免 Agent 在⼯具调⽤间「迷失」?

答案:

  • 明确 停⽌条件最⼤步数
  • 维护 任务清单(todo) 与 当前⼦⽬标
  • 对每步输出要求 结构化(JSON)
  • 关键步骤 强制验证(单元测试式检查、⼆次 LLM 审核)

Q3:结果冲突怎么整合?

答案:优先级规则(权威源 > 时间新 > 多源⼀致)、让模型显式输出「冲突说明」、必要时触发⼈⼯。

Q4:基于效⽤的 Agent 和基于⽬标的有什么区别?

答案:⽬标型关注「是否达成」;效⽤型在多个冲突⽬标间做权衡(成本、时延、⻛险、⽤户偏好),选综合最优⽽⾮单点达成。

Q5:反应式 Agent 有什么优缺点?

答案:

优点:快、可解释、易测试。

缺点:对⻓程依赖与复杂推理弱;遇到未⻅输⼊可能失效。常与分层架构结合。

大模型、Agent面试八股全集 文章被收录于专栏

大模型面试,早已不只是会用 LangChain、会调 OpenAI API 那么简单。真正决定面试深度的,是你是否理解 Transformer、Prompt 工程、RAG 检索链路、Agent 规划与执行、工作流设计,以及复杂场景下的稳定性与工程落地问题。本专栏聚焦大模型与 Agent 开发面试高频八股,系统拆解核心概念、常见追问、项目回答思路,帮助你系统掌握核心考点,提升面试表达与项目答辩能力。

全部评论

相关推荐

不愿透露姓名的神秘牛友
04-30 17:45
本人简历上 1 个 RAG 项目 + 1 个 Agent demo;这次面的是AI岗一面前我以为:背完八股 + 把项目讲清楚,应该能稳过。0-5 min:自我介绍 + 项目背景- 顺利。讲清楚了我的 RAG 是给法律咨询场景做的,痛点是大模型不懂行业术语。5-20 min:项目深挖(开始崩)- Q1:你的法律文档总共多少?切了多少个 chunk?- 我:约 500 份 PDF,5 万个 chunk- Q2:500 份 PDF 加起来才 5 万 chunk?平均每份 100 个 chunk,你切片粒度是多少?- 我:512 token- Q3:法律文档里"第三条第二款"和"第三条之二"是不同含义,你的切片会不会把它切散?- 我:(沉默 5 秒)……应该会- Q4:那你怎么解决?- 我:我可以加一个 metadata……(开始编)❌ 第一次崩:切片粒度没考虑业务语义。20-35 min:评测体系(继续崩)- Q:你怎么知道你的 RAG 有效?- 我:我用 Recall@5……- Q:评测集多少条?怎么构造的?- 我:100 条,我手工标注的- Q:100 条够吗?分布怎么样?- 我:分布……我没分- Q:那你的 Recall@5 是 0.81,你怎么知道这个数字是好是坏?baseline 是什么?- 我:(沉默 10 秒)❌ 第二次崩:没有 baseline,没分布分析,纯靠"看起来还行"。35-55 min:Agent 部分(彻底崩)- Q:你的 Agent demo 用了几个工具?- 我:3 个,搜索、计算器、文档查询- Q:当用户问一个问题,你的 Agent 怎么决定调哪个工具?- 我:用 ReAct,让模型自己决定- Q:模型决策错了怎么办?- 我:我加了个 reflection……- Q:reflection 失败 3 次后怎么处理?- 我:(沉默 15 秒)……我没想过❌ 第三次崩:异常路径完全没设计。55-65 min:业务理解 + 反问- Q:你觉得字节做 AI 应用最大的瓶颈是什么?- 我:算力?数据?- Q:你看过哪些字节最近发的 AI 产品?- 我:豆包、扣子……- Q:扣子是 Agent 平台还是工作流平台?- 我:(再次沉默)❌ 第四次崩:对面试公司业务一无所知。
牛客41664080...:切片粒度问得好
面试官拷打AI项目都会问...
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务