字节面试官问:什么时候工作流就够了,什么时候才该上 Agent?

字节跳动,某 AI 平台组二面。面试官给了一个真实场景:客服系统每天处理上万条工单,团队想用 AI 接管一部分。候选人答了十分钟,核心观点是"agent 更智能,应该直接上 agent"。面试官追了一句:"你的 agent 调试周期是多久?如果工单处理延迟翻倍,业务能接受吗?"

这道题看似在问技术选型,实际在考判断力:你有没有能力在"能做"和"该做"之间划线。

二、大多数人怎么答的

最常见的回答是:"这个任务有多个步骤,需要调 API、查数据库、做判断,肯定得用 agent。"

问题出在一个隐含假设:多步骤 = 需要模型自主决策。但大多数多步任务的路径是固定的——先分类,再查库,再生成回复——每一步该做什么、做完跳到哪一步,你在写代码的时候就知道了。这种情况下硬上 agent,相当于把本来确定的路径交给模型"重新发明"一遍,代价是延迟更高、调试更难、结果更不可控。

典型误判: "任务复杂、步骤多,就该上 agent。" —— 其实大部分复杂任务只需要 workflow。

三、正确判断框架

alt

alt alt

五、落地案例:客服工单系统

实战拆解: 同一个客服系统,常规工单走 workflow,复杂投诉走 agent——两条路线对比。

alt

六、上线坑点坑

坑1:为了显得先进,过早上 agent

调试成本是 workflow 的 5-10 倍。同样的输入可能走不同路径,复现问题极难。如果 workflow 能解决,永远优先 workflow。

坑2:把固定规则写成模型判断

"如果金额超过 500 就走人工审批"——这是一行 if 的事。交给模型判断只是增加不必要的不稳定性和成本。

坑 3:agent 没有 fallback

agent 决策失败后没有降级路径。必须设计好:agent 超时或信心不足时,自动退回到 workflow 或升级人工。 alt

#AI求职实录#
全部评论
好文
点赞 回复 分享
发布于 04-27 17:19 广东

相关推荐

不愿透露姓名的神秘牛友
04-30 17:45
本人简历上 1 个 RAG 项目 + 1 个 Agent demo;这次面的是AI岗一面前我以为:背完八股 + 把项目讲清楚,应该能稳过。0-5 min:自我介绍 + 项目背景- 顺利。讲清楚了我的 RAG 是给法律咨询场景做的,痛点是大模型不懂行业术语。5-20 min:项目深挖(开始崩)- Q1:你的法律文档总共多少?切了多少个 chunk?- 我:约 500 份 PDF,5 万个 chunk- Q2:500 份 PDF 加起来才 5 万 chunk?平均每份 100 个 chunk,你切片粒度是多少?- 我:512 token- Q3:法律文档里"第三条第二款"和"第三条之二"是不同含义,你的切片会不会把它切散?- 我:(沉默 5 秒)……应该会- Q4:那你怎么解决?- 我:我可以加一个 metadata……(开始编)❌ 第一次崩:切片粒度没考虑业务语义。20-35 min:评测体系(继续崩)- Q:你怎么知道你的 RAG 有效?- 我:我用 Recall@5……- Q:评测集多少条?怎么构造的?- 我:100 条,我手工标注的- Q:100 条够吗?分布怎么样?- 我:分布……我没分- Q:那你的 Recall@5 是 0.81,你怎么知道这个数字是好是坏?baseline 是什么?- 我:(沉默 10 秒)❌ 第二次崩:没有 baseline,没分布分析,纯靠"看起来还行"。35-55 min:Agent 部分(彻底崩)- Q:你的 Agent demo 用了几个工具?- 我:3 个,搜索、计算器、文档查询- Q:当用户问一个问题,你的 Agent 怎么决定调哪个工具?- 我:用 ReAct,让模型自己决定- Q:模型决策错了怎么办?- 我:我加了个 reflection……- Q:reflection 失败 3 次后怎么处理?- 我:(沉默 15 秒)……我没想过❌ 第三次崩:异常路径完全没设计。55-65 min:业务理解 + 反问- Q:你觉得字节做 AI 应用最大的瓶颈是什么?- 我:算力?数据?- Q:你看过哪些字节最近发的 AI 产品?- 我:豆包、扣子……- Q:扣子是 Agent 平台还是工作流平台?- 我:(再次沉默)❌ 第四次崩:对面试公司业务一无所知。
牛客41664080...:切片粒度问得好
面试官拷打AI项目都会问...
点赞 评论 收藏
分享
评论
8
41
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务