一二面同时吗?我的天,压力好大
1 2

相关推荐

最近大厂招 Agent 工程师的岗位非常多,没有入门的朋友可能觉得“Agent不就是调调 API 吗?”Agent 不同于传统的“一问一答”式 AI,它是在对话模型的基础上增加了一个自主循环,能够根据任务目标判断“还需要做什么”,并调用外部工具执行。理想中的Agent,人类一动嘴,LLM跑断腿,在我们还喝茶打哈欠的时候就把活全干完了,但在实际落地中,想做出一个稳定可用的产品,还是有很多难点的。首先是工具的适配。在一个可用的 Agent 系统中,AI 推理只占约 30% 的逻辑,剩下的 70% 都是非AI的工程化适配。Agent 必须能够稳定处理现实世界的接口边界问题,包括 OAuth 授权、Token 自动刷新、API 速率限制以及海量数据的分页处理。同时,工具的 Schema 定义直接影响调用准确率。优秀的 Agent 需要对工具的粒度和描述进行反复调优,确保模型在面对数十个可选工具时,指令遵循依然清晰稳定。其次是多步任务的可靠性管理。在长链条推理中,错误会随步骤指数级叠加。哪怕单步准确率达到 80%,连续执行五步后的综合成功率也会降至约 32.8%。这种概率衰减意味着一个微小的幻觉就能让整个任务偏航。好的 Agent 必须具备严密的状态管理,能够在执行异常时实现自动捕获、重试或逻辑回滚。在执行关键操作前,还需要设计逻辑校验环节,防止单个步骤的偏移导致整体任务崩溃。接着是上下文的信息治理。大模型在处理长周期任务时普遍面临指令丢失的问题,尤其是在频繁的工具调用产生大量冗余数据时,核心约束容易被边缘化,导致 Agent 出现“失忆”现象。优秀的工程实践需要实现动态内存管理,精准识别并保留关键指令和历史摘要,同时剔除无意义的中间日志。通过提高上下文的信息密度,不仅能降低幻觉风险,也能在多模型路由中有效控制 Token 成本。最近开源社区非常火的 OpenClaw就是一个典型的例子。它作为一个拥有极高系统权限的 Agent 框架,可以直接操作文件和执行命令,极大地扩展了 AI 的能力边界。但在实际应用中,它的提示词工程仍有提升空间。由于权限极高,如果提示词无法精准约束模型的行为,很容易在复杂的执行链条中产生误操作甚至安全风险,且频繁触发的记忆压缩和超高的token消耗也被人诟病。这也是目前高权限 Agent 在落地时面临的核心痛点之一。总的来说,Agent 开发的本质是构建一个以模型为核心的高可靠软件系统。调通接口只是基础,真正的护城河在于你如何处理那些繁杂的非 AI 细节,包括工具层的异常处理、上下文的动态压缩以及评估体系的建立。正在找相关工作的同学,可以看看你简历上的Agent项目,有没有针对以上的痛点做了有效改进,面试官会很感兴趣的。
AI求职实录
点赞 评论 收藏
分享
04-11 17:34
已编辑
重庆大学 Java
面试时间:3.30上午11点面试时长:1h5min部门:到家的搜索工程组?(没听清)自我介绍1、完整讲一下你的 RAG 项目(离线 + 在线 + 架构)2、重叠大小分块是自己做的吗?还是用的什么工具?3、向量化用的模型是什么,还记得吗?然后这个模型是你自己部署的吗?还是调的LLM接口?4、专门做过什么策略来提升召回率和准确率?如何评测召回率和准确率,有没有做过数字化的评估?5、如果说你的 embedding 质量比较高的话,那这个评测确实没有问题,但如果说就是向量化的效果没那么好的话,那这个方案好像也并不是很行得通,因为它可能生成向量的时候就会有问题,这个有考虑过吗?然后你有没有想办法去……(接着面试官说,算了不问了)6、关键字检索是怎么做的?7、你可以说一下在线的部分,就是用户从一个请求,到它最终拿到结果的一个过程?8、你刚才说意图节点,也就是意图识别的时候去识别它关联的那个叶子节点,我想问一下你这块是怎么实现的?9、你刚才说首先有多路召回,多路检索,然后每一路检索里面会有一个粗排,然后这些结果拿到之后可能还会有一个细排。然后想问一下你这两个排序大概都是怎么做的?然后如果是用模型排的话,你这分别是用什么模型?然后你知道这些模型的检索排序的原理吗?10、重排序用的什么模型?11、你可以再总结一下,就是从你这个离线到在线的过程中有多少次和大模型的交互吗?分别简述一下。12、我看你这个里面会有那个模型的,多模型的降级策略和熔断机制,你可以简单说一下,你现在是有哪几个模型之间可以降级?然后以及是怎么实现的?13、你这个降级是手动降级吗?还是自动降级?14、那这个自动降级是怎么感知的?比如说从模型里是刚才三个状态,它们三个状态之间流转是什么样子的?就什么情况下就把它变为异常了?然后什么情况下会让它自动恢复正常?还是就是怎么做的这块?15、看你这个里面还支持了那个 MCP 的工具调用,然后你可以说一下你现在支持哪些那个MCP,然后以及这些 MCP 是怎么和模型交互,然后大概的实现原理吗?(这一部分不太会,就扯到MCP与function calling的区别了)16、那function calling的话是怎么调呢?是 RPC调还是HTTP调?还是怎么调用的?17、看你这边那个会话,大概是怎么存储的?可以说一下吗?18、然后就是你这个会话就是大概是一个什么样的存储结构呢?可以说一下这个 MySQL表的存储的结构,就是哪几个关键字段?19、就比如说一个用户可能在一个会话里面和模型会有多轮的这种对话。就比如说问了一个问题,模型回答一次,然后我再问一个问题,他再回答一次,再问,再回答。这样的结构在数据库里面是怎么存的?是一条还是多条?20、然后就是你这个 message 表大概是一个什么结构?就是有哪几个关键字段?21、看你这个里面用到了那个Redis,然后你可以解释一下那个 Redis 的缓存穿透、缓存击穿以及缓存雪崩吗?以及具体解决思路?22、然后那个布隆过滤器,你可以说一下布隆过滤器的实现原理吗?算法题:合并区间23、然后我们谈一下,就是之前就是那个AI coding的那个面试题,然后你可以简单说一下你这边实现的思路吗?(这个是美团面试前发的AI Coding的题目,让设计一个限流中间件)24、我再问一下,就是你认为它的这个Lua脚本能满足那个需求吗?(要求同一个用户60秒内只能发送60个请求)这里面试官理解的是滑动的时间窗口,但是我实现的是固定的时间窗口,题目中只说了“时间窗口”,然后面试官就说你这个实现好像也没有问题。反问1、业务2、具体工作3、建议做项目其实可以更深入一点,而不是说只是作为一个 API 的调用方,就比如说这些模型,因为其实我们日常就是也会和这些模型交互之类的,你除了知道调它这个API,你可能需要更多的去了解一下,就是我为什么要这么设计,然后以及我这个模型具体能做什么东西,它大概是怎么实现的,有了这些可能对你未来会更有帮助,然后职业生涯可能更具有那个什么。(录音没录到,估计是想表达“更具有竞争力”这个意思吧)感受:面试官问的很细,能感觉出来面试官真的很专业,但是自己对于大模型相关底层原理的理解显然不够深入,MCP具体的工具调用也没来得及研究,属于半吊子水平也是第一次拿RAG项目来面试,这个面试官真的让我学到了很多,也让我知道了自己诸多的不足以及还需要提升的地方。整体面试体验感很好,面试官也不会特意刁难,我表达的很含糊的地方或者不会的地方,就是一句“行”帮我带过,感谢面试官现在还没消息,大概率是寄了,下去好好沉淀了二编:4.1晚上6点约二面。
查看26道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务