小米 AI Agent开发 二面

1. 你怎么理解 Agent,和普通大模型问答最大的区别是什么?

答:普通大模型问答更像是“你问我答”,核心是根据上下文生成一段自然语言。Agent 不一样,它更像一个会做事的系统,除了生成文字,还要能理解任务、拆解步骤、调用工具、读外部信息、根据执行结果继续往下走。所以 Agent 的重点不是“模型会不会说”,而是“模型能不能在复杂任务里做对决策”。比如普通问答模型适合解释概念,Agent 更适合处理像“帮我查一下某个信息,再结合文档输出结论,最后按固定格式返回”这种任务。如果放到手机或系统场景里,Agent 往往还要接系统能力、应用能力和设备能力,这就不再只是聊天了。

2. 你如果做一个手机端 Agent,整体架构会怎么设计?

答:我会拆成五层。最上面是用户交互层,负责接收文字、语音、多轮上下文。下面是意图理解和任务路由层,用来判断这是直接问答、知识检索、系统操作还是多步任务。再往下是规划层,负责把复杂任务拆成几个可执行步骤。然后是工具层,接搜索、日历、提醒、短信、地图、系统设置、知识库这些能力。最下面是执行与观测层,负责日志、超时、重试、权限控制和结果回收。如果是手机端 Agent,还要特别考虑延迟和资源消耗,不能什么都走云端,也不能每一步都让大模型长链路推理。实际落地时通常会做成 规则 + 小模型 / 分类器 + 大模型 + 工具调用 的混合方案,而不是完全依赖大模型自由发挥。

3. Agent 的工具调用怎么做得更稳?

答:先把工具定义清楚。工具名、适用场景、参数含义、返回格式、失败时的错误码都要写明确,不然模型很容易选错。第二是减少工具重叠。如果两个工具都能查天气,但一个查实时天气,一个查未来天气,描述不清就很容易误调用。第三是给模型明确边界,比如什么情况下必须调工具,什么情况下禁止自行编造,什么情况下要先澄清用户信息。最后是做执行层兜底。哪怕模型给出了工具调用结果,也要再做参数校验、权限校验和异常处理。真正稳定的 Agent,不是提示词写得多花,而是工具协议、路由逻辑和失败兜底做得扎实。

tools = [
    {
        "name": "query_calendar",
        "description": "查询用户日历安排,适用于查看某一天是否有会议或日程",
        "parameters": {
            "type": "object",
            "properties": {
                "date": {"type": "string", "description": "日期,格式为YYYY-MM-DD"}
            },
            "required": ["date"]
        }
    }
]

4. 你怎么理解 RAG,在 Agent 里它和工具调用是什么关系?

答:RAG 解决的是“模型知道什么”的问题,工具调用解决的是“模型能做什么”的问题。RAG 更偏向知识获取,比如查产品文档、查业务规则、查企业知识库;工具调用更偏向动作执行,比如发消息、查数据库、调接口、改状态。在 Agent 里这两个能力通常是一起用的。先通过 RAG 拿到事实依据,再决定要不要调用工具完成动作,或者先调用工具获取结构化结果,再让模型做总结。所以 Agent 不是单纯接个知识库就够了,它需要把“信息获取”和“任务执行”结合起来。如果知识问答和系统操作都要做,那 RAG 和工具调用基本都绕不开。

5. 多轮对话里 memory 应该怎么设计?

答:memory 不能简单理解成“把所有历史对话全塞进去”。更合理的做法是分成短期记忆和长期记忆。短期记忆保留当前任务必须用到的上下文,比如刚刚确认过的时间、地点、联系人、任务目标;

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏 文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.

全部评论

相关推荐

面试流程速览- 形式:视频面试- 时长:60分钟左右- 轮次:春招前端(业务+算法+手写实战)- 特点:重项目深挖+高频手写+现场手撕算法,节奏非常快---一、面试真题(完整回忆版)1. 开场必问- 自我介绍(1分钟以内,突出项目与技术栈)- 实习期间做过的核心业务、遇到的**重难点**- 项目卡顿问题排查:你是怎么定位、怎么优化的?(面试官重点追问)2. 项目深挖(AI相关)- AI项目具体做了什么功能?- 用了哪些AI SDK?整体架构怎么设计?- 有没有用到LangChain?为什么没用?- 理论掌握程度 vs 工程落地能力(面试官明确看重**实战落地**)3. 手撕代码环节(高频原题!)1)**算法题**LeetCode 寻找峰值(二分查找)- 要求:不能本地测试,直接写思路+代码- 注意:边界条件、mid计算、左右判断- 踩坑:面试官会逐行挑错,哪怕逻辑对也会抠细节2)**前端手写组件****倒计时组件(大厂超高频)**- 用 requestAnimationFrame 实现- 追问:**60帧下raf间隔多少ms?**- 标准:16ms 左右- 面试官提示:可按 30ms 理解作答4. 反问环节(超有用干货)我问了两个问题,面试官直接给了学习路线:1)前端+AI 学习建议- 看 Claude Code 源码,学习 Agent 设计- TS 是 AI 前端开发主流语言,必须吃透- 动手做:构建 Agent,集成 Skills、MCP、Tools- 练手:用 VibeCoding 写一个浏览器插件2)业务方向PDD 前端业务覆盖广泛,侧重**性能优化、复杂交互、稳定性、高并发场景**---二、二面核心考点总结1. **项目真实度**:必须讲清楚难点、卡点、解决方案,不要虚2. **性能优化**:卡顿、渲染、长任务是必考点3. **算法**:二分查找是高频简单题,一定要熟练4. **前端实战**:倒计时、懒加载、防抖节流、SSE 这类组件必考5. **技术视野**:前端+AI 是现在 PDD 重点关注方向---三、给后续同学的避坑建议1. 算法题哪怕写对,也要**讲清思路**,不然容易被判定背题2. raf、定时器、渲染机制这类基础要牢,别临场卡壳3. AI 项目不要只说概念,**一定要有落地代码/架构**4. 实习经历重点突出:**问题→方案→效果**,逻辑清晰5. 反问环节多问学习&业务,能大幅加分---
查看9道真题和解析
点赞 评论 收藏
分享
评论
6
35
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务