02-26 17:33 已编辑山东大学嵌入式软件工程师发布于山东

关注

面试被问到“agent的记忆机制怎么设计”，该怎么回答？

我头一次听这个问题的时候，寻思，这不简单，现在模型的上下文那么老长，“用向量数据库存历史对话，每次检索相关内容拼进去”，不就得了。

然后过年吃饭和一个做算法的同学聊到这里，他告诉我，这样回答根本拿不到分。

1.先看GPT咋做的

前阵子网上比较火的一个帖子，有开发者通过对话实验，把ChatGPT的记忆机制逆向了出来。结果挺让人意外的，整套系统没有向量数据库，没有RAG，没有 Embedding 召回，甚至连相似度匹配都没做。就是四层纯结构化设计，干干净净。

我当时也疑惑：GPT又不算Agent，这个例子能说明什么？你先罚一杯！

ChatGPT的确是对话产品，不是严格意义上的Agent。但它的Memory设计思路，刚好就是Agent记忆系统的问题：哪些信息该靠检索获取，哪些压根不需要检索？

2.GPT为啥不选向量数据库？

归结下来就两个原因。

原因一：向量检索天然是模糊匹配，而很多记忆需要精确命中。

比如用户上周说过“我的预算是5万”，今天直接问“预算多少来着？”你要是走向量检索，召回的大概率是一堆沾边的内容，聊过的各种数字、各种花钱的场景……真正需要的那条记录不一定能排在前面。换成结构化存储就不一样了，直接读“用户预算”这个字段，一步到位，想出错都难。

原因二：向量数据库对"信息更新"这件事很不友好。

用户会改主意。上周预算5万，今天说改8万了。向量库里新旧两条都躺着，检索可能同时召回，模型根本分不清该信哪条。但结构化存储本来就支持覆盖，新的值写进去，旧的就没了，永远只保留最新状态。

你当然可以给向量库加metadata、打时间戳、写过滤逻辑，折腾一圈也能达到精确召回的效果。但既然数据本身就是结构化的，还为啥非要用模糊匹配的工具去检索它呢？

就好比你明知道钥匙在左边裤兜里，却偏要把浑身上下翻一遍再排个序。能找到，但也太累了吧。

3.正确做法：按类型分层

记忆不是铁板一块，拆开来看至少有4个层次：

①当前对话上下文：压根不用额外存储，滑动窗口天然覆盖。

②用户长期画像：姓名、职业、偏好、目标这类稳定事实。应该做成结构化的用户档案，支持随时修改，精确读写。

③近期交互摘要：用户最近在关注什么、讨论过什么方向。一份轻量的摘要清单就够了，不必保留完整对话原文。

④历史经验库：曾经生效的方案、踩过的坑、处理过的案例。只有这一类，才是向量检索好使的地方。

所以你看，向量数据库只覆盖了四类记忆中的一类，远远算不上万能解法。

4.ChatGPT 被逆向出来的四层结构

实际被扒出来的架构，和上面的分类高度吻合：

第一层	会话元信息（设备、时区、交互习惯）	临时变量	实时微调回复风格，用完即弃
第二层	用户画像（姓名、职业、偏好、长期目标）	结构化档案	支持增删改，按字段精确读取
第三层	近期对话摘要（最近十几轮的主题和要点）	轻量清单	不留原文、不做检索，直接拼入Prompt
第四层	当前对话（最近N条消息）	Token滑动窗口	溢出就丢弃最早的部分

全程没向量库，没RAG，靠的就是分层策略。

5.背后的逻辑

该精确查的就结构化存，该模糊找的才上检索。

向量数据库擅长的是那些开放的、模糊的、没法提前穷举的内容。比方说用户问“上次咱们聊过一个XXX相关的话题”，这种场景下语义搜索确实好使。

但在绝大多数Agent场景里，Memory的核心诉求是精确、可控、可更新：用户预算是多少？用户身份是什么？上一轮选定的是哪个方案？这些都是确定性的事实查询，不是语义相似度问题。

6.向量数据库到底什么时候用？

同时满足三个条件的时候：

内容本身是非结构化的
数据量会持续增长
查询方式是模糊语义的

典型场景：客服Agent，要从几万条历史工单里找类似案例，这时候向量检索是最优解。

但如果只是让Agent记住用户的基本信息和最近的对话脉络，结构化存储配合摘要机制完全够用，而且响应更快、结果更准、维护更简单。

7.最后

Agent的Memory不是一个单点模块，而是一套分层体系，不同性质的记忆，对应不同的存取策略：

当前上下文	滑动窗口
长期事实	结构化存储
近期脉络	轻量摘要
历史案例	向量检索

向量数据库是个工具，但不是万能的，哪有啥万能钥匙。面试时这么回答，展现的不是你背了多少方案，而是你理解每种方案各自在解决什么问题。

下次再被问到这题，别急着蹦出“向量数据库”三个字。先反问一句：你们的Memory需要承载哪几类信息？

他跟我说，能问出这句，且能针对不同情况做回答，就能加分，我说：那你再罚一杯吧！

#AI求职实录#

AI面试题目精讲文章被收录于专栏

AI 面试题目精讲专栏：一题一讲、一讲一通透，系统提升 AI 面试应答能力与竞争力

全部评论

推荐最新楼层

这个杀手不太冷静

吉林大学运营

结构化存事实，向量库找案例

2 回复分享

发布于 02-27 11:04 吉林

中华女子学院 Java

好东西哈，继续多分享~~~~

点赞回复分享

发布于 03-06 00:16 广东

拒绝pua的熊猫很勇敢

门头沟学院数字IC后端设计

是不是也跟上下文有关系

点赞回复分享

发布于 02-27 11:03 广东

上海理工大学电芯研发工程师

牛逼啊，这分析

点赞回复分享

发布于 02-27 11:01 上海

牛客社区推荐官

牛客运营

我还以为拼prompt就行…

点赞回复分享

发布于 02-27 11:00 广东

项目上线送命

湖南大学 FPGA工程师

RAG只配打替补（hh

点赞回复分享

发布于 02-27 10:59 湖南

努力上岸的琪琪

中国农业大学运营

向量库不是万能钥匙

点赞回复分享

发布于 02-27 10:59 北京

03-28 14:12

广西大学算法工程师

万类智生 AI Agent开发二面

1. 项目拷打2. Agent 和传统工作流到底有什么区别传统工作流更像一个提前画好的流程图，路径基本固定，输入来了以后按节点顺序执行，比如分类、检索、总结、返回。它的优点是稳定、可控、好排查，比较适合业务规则明确的场景。Agent 的核心不是“多一步调用模型”，而是“具备动态决策能力”。它会根据任务目标、当前上下文和外部环境决定下一步做什么，比如先查知识库还是先问用户补信息，要不要调工具，要不要继续分解任务。实际落地里，纯 Agent 和纯工作流都不多，更多是混合架构。主链路用 workflow 保稳定，在复杂节点里再让 Agent 做决策，这样可控性和灵活性都会更好一些。3. 你理解的 A...

AI-Agent面试实战...

点赞评论收藏

分享

03-30 20:35

北京政法职业学院算法工程师

日常实习有转正机会不

主包想尝试一下蚂蚁的日常实习，这个有转正机会不

点赞评论收藏

分享

04-02 23:21

广西大学算法工程师

懂车帝 AI Agent开发一面

1. 讲一下你做过的一个 Agent 项目，重点说业务背景、流程和你负责的部分2. 如果你的系统里也有高并发场景，你会怎么设计限流、降级和幂等高并发下最怕的不是平均请求慢，而是少数慢请求把整条链路拖死。Agent 系统一般调用链长，请求里既有模型推理，也有工具 I/O 和数据库操作，所以不能只靠一个网关限流就完事。我会把限流拆成几层：入口做用户级和租户级限流，任务编排层做任务队列隔离，工具层做并发池控制，模型层再做 token 预算和超时回收。这样某一个工具服务出问题时，不至于把整个系统打爆。幂等也很关键，尤其是有写操作的时候。像发通知、写审批、更新状态、创建工单这种动作，必须给每次执行一个 ...

AI-Agent面试实战...

点赞评论收藏

分享

03-25 20:36

门头沟学院 Java

提前交卷，看到第三题发现构造树都构造不了，退出去发现做不了第二题了，白给了🌚

我就不信了好吧：太吓人了这笔试

点赞评论收藏

分享

04-06 17:44

已编辑

电子科技大学后端工程师

阿里国际AI开发暑期一面

1.拷打实习2.sse流是什么，和ws有什么区别3.还有什么全双工协议4.react主要流程介绍5.上下文压缩具体怎么做6.滚动上下文窗口了解吗7.大模型输出内容格式不对前端无法渲染怎么兜底8.mcp是什么，核心概念9.mcp的传输方式10.开发一个mcp服务器，给出大概思路11.如果你开发的mcp负载很高不堪重负怎么解决12.mcp有什么安全问题，如何解决------两天后约二面

查看11道真题和解析

点赞评论收藏

分享

评论

4

42

招聘动态

AI网申助手

网申字段一键填写

龙湖集团数字科技平台

2026届春季招聘&实习生招聘

米哈游2026校园招聘

应届生春招&全年实习生专项

招商银行信用卡中心

2027届暑期训练营

阿里巴巴集团

2027届实习生校园招聘

正浩创新EcoFlow

2026届春季校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 有哪些公司在面试时考察AICoding？ #

9302次浏览 192人参与

# 你认为小厂实习有用吗？ #

137613次浏览 745人参与

# 厦门银行科技岗值不值得投 #

23966次浏览 506人参与

# HR面都在聊什么？ #

7469次浏览 89人参与

# 如何快速融入团队？ #

47968次浏览 299人参与

# 父母问你工作找得怎么样，怎么回 #

15723次浏览 194人参与

# AI“智障”时刻 #

35035次浏览 155人参与

# 找工作如何保持松弛感？ #

136989次浏览 1469人参与

# AI时代还有必要刷leetcode吗？ #

6046次浏览 99人参与

# 想从事Agent应该学习哪些技术？ #

4125次浏览 133人参与

# 那些我实习了才知道的事 #

286815次浏览 1810人参与

# 什么人最适合大厂？ #

8206次浏览 82人参与

# 哪些公司面试还在问八股？ #

8394次浏览 84人参与

# 从投递到OC，你用了多久 #

14917次浏览 133人参与

# 顺丰求职进展汇总 #

84429次浏览 362人参与

# 查收我的offer竞争力报告 #

292618次浏览 1738人参与

# 如果没找到工作，考公是你的退路吗 #

70589次浏览 458人参与

# 双非本科的出路是什么？ #

227684次浏览 1651人参与

# 哪一刻你突然觉得实习“有点值了” #

8953次浏览 71人参与

# 我的求职进度条 #

1035402次浏览 7106人参与

# 秋招踩过的“雷”，希望你别再踩 #

196234次浏览 1752人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务