北京飞鸟卫士 AI Agent 一面

1、自我介绍

2、介绍一下实习

3、你们的 Agent 项目落地完成后，是直接交付给业务方还是让对方调用 API

这两种方式都常见，区别主要在交付形态。

如果是直接交付给业务方，一般会做成完整应用，比如网页端、内部工作台、客服系统插件或者企业微信机器人。业务方直接使用现成系统，不需要关心底层模型、检索、工具调用这些实现细节。这种方式更适合业务部门直接落地，优点是使用门槛低，缺点是后续定制需求可能会比较多。

如果是提供 API，通常说明 Agent 能力被当成平台能力输出。业务方或者其他系统通过接口调用，比如传入用户问题、上下文信息、用户 ID，再拿回模型结果。这种方式更适合中台化建设，扩展性更强，不同业务系统都能复用同一套能力。

如果是企业内部项目，很多时候会同时做两层：底层提供 API，上层再封装成可用页面或者业务入口。这样既方便集成，也方便后续复用。

4、讲一下你认为你负责的部分比较难的地方

我负责的部分里，相对更难的是意图识别和多轮对话管理。因为 AI Agent 项目里，模型能不能答对，不只是看生成能力，很大程度上看前面的路由有没有做对。用户一句话进来以后，如果意图判断错了，后面整个链路都会错。比如用户本来是查订单，结果被当成知识问答去检索知识库，那最后答案肯定偏掉。

意图识别难主要难在几个地方。一个是用户表达不标准，口语化、歧义、多意图混杂的情况很多。另一个是业务场景里意图边界有时候并不清晰，比如“帮我看下这个产品适不适合老人用”，既像产品咨询，也可能涉及推荐。再一个是线上输入噪声很大，用户不会按训练数据那种标准句式提问。

所以实际做的时候，通常不会只靠单一分类模型，而是会结合规则、关键词、少量人工标注样本以及大模型辅助判断一起做。这样做的目的，不是追求理论上多先进，而是先把线上可用性做稳。

5、项目中意图识别部分你们用户画像是怎么做的

用户画像主要是为了辅助意图判断和后续回答生成，不是单独为了存用户信息。

常见做法是把用户画像拆成显式信息和隐式信息。显式信息一般来自注册信息、角色信息、部门信息、历史业务记录，比如用户属于哪个业务线、是什么身份、有没有购买记录、最近关注过什么内容。隐式信息更多来自行为数据，比如最近连续问了哪些问题、点击过哪些内容、经常在什么时间段使用、偏向哪类问题。

在 Agent 场景里，用户画像最直接的作用有两个。一个是帮助意图识别。比如同样一句“帮我查一下”，管理员和普通用户可能对应完全不同的业务动作。另一个是帮助回答个性化。比如不同角色查同一问题，返回内容权限范围可能不同，展示重点也可能不同。

如果从实现上说，用户画像通常不是一次性全塞进 prompt，而是会做结构化管理。需要的时候只取当前任务相关的信息，避免上下文太长、噪声太大。

user_profile = {
    "user_id": "u1001",
    "role": "运营",
    "department": "风控",
    "recent_intents": ["查报表", "查订单", "知识问答"],
    "product_focus": ["企业安全", "告警平台"],
    "permission_scope": ["report_read", "order_read"]
}

6、你们是怎么管理历史信息或者对话的

对话历史管理的核心不是全存，而是怎么存、什么时候取、取哪些。

如果把所有历史对话无脑拼进上下文，会有几个问题：一是 token 开销大，二是噪声多，三是旧信息可能会干扰当前回答。所以一般会分层管理。

一种常见做法是短期记忆加长期记忆。短期记忆就是当前会话窗口内最近几轮对话，主要保证上下文连续性，比如用户说“这个再详细一点”“那第二个呢”，模型要知道“这个”和“第二个”指的是什么。长期记忆则是把一些稳定信息抽出来单独存，比如用户偏好、历史关注主题、重要事实、业务配置等，不会每轮都原样塞进去，而是在必要时检索出来再补充。

如果是工程上实现，通常会保留最近 N 轮对话，再配合摘要机制。也就是对过长历史先做总结，后续只带摘要和关键轮次，而不是把所有原文带上。

from collections import deque

class ConversationMemory:
    def __init__(self, max_turns=5):
        self.history = deque(maxlen=max_turns)

    def add_message(self, role, content):
        self.hi

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.