05-13 00:38 中国科学院大学自然语言处理发布于浙江

关注

Binance 一面 | AI大模型实习 | Binance Accelerator Program

面试时间： 5.13

技术栈： Python、Agent、Multi-Agent、RAG、Claude Code

岗位链接： Binance Accelerator Program - Institutional Business Development

面试流程

自我介绍 → 手撕算法 → 项目问答（拷打Agent技术）

面试题目

1.自我介绍

2.手撕算法：最小覆盖子串（Hard，LeetCode 76）

滑动窗口经典题。维护一个窗口 [left, right]，用哈希表记录 t 中字符频次需求，当窗口满足所有需求时尝试收缩左边界。时间 O(n)，空间 O(字符集大小)。核心思路：right 扩张找可行解，left 收缩找最优解。注意用一个 formed 计数器追踪已满足的字符种类数，避免每次都遍历哈希表判断是否满足。

3.介绍项目开发过程，是如何和 Claude Code 配合完成的项目起步

核心回答思路： 讲清楚 Vibe Coding 的工作流。起步阶段：先写 CLAUDE.md 定义项目规则和技术栈约束 → 用自然语言描述目标（What/Why/How）→ Claude Code 生成初始架构和代码骨架 → 人工审查关键设计决策 → 迭代修正。配合方式：把"脑中隐性知识"外化为项目文件（CLAUDE.md + Memory + Plan），让 Agent 每次启动都能接上上下文。关键是人定方向、Agent 执行细节，人负责架构审查和边界判断。

4.是否有 PRD 文档可以展示

有。用 CLAUDE.md + 项目 Memory 文件作为"活 PRD"——不是传统的 Word 文档，而是随代码一起版本管理的规则文件。里面定义了：技术栈选型、目录结构规范、代码风格约束、禁止事项、模块职责划分。优势是 Agent 每次启动自动加载，保证开发一致性。

5.是否使用 harness 约束

是的。用 Claude Code 的 hooks 机制（settings.json 中配置的自动化行为）约束 Agent 的行为边界。例如：禁止 git push 到远程、提交前自动运行引号修复脚本、工具调用权限白名单等。Harness 的本质是把"人的审查规则"编码成系统级约束，让 Agent 在安全边界内自由发挥而不失控。

6.共享屏幕介绍项目构思迭代过程

展示 git log 的提交历史 + CLAUDE.md 的演进过程。重点讲：从最初的 MVP → 遇到什么问题 → 怎么迭代架构 → 每次迭代的 commit message 记录了什么决策。用 git diff 展示关键迭代节点的变化量。核心是让面试官看到"渐进式交付"的过程，而不是一次性生成。

7.新闻交易 Agent 项目管线如何搭建？agent 响应延迟是多久？新闻到交易完成需要的时间？

管线架构：
新闻源（RSS/API）→ 新闻抓取 Agent → 情感/事件分析 Agent → 交易信号生成 Agent → 风控校验 → 交易执行 Agent
延迟拆解：

新闻抓取：RSS 轮询间隔 5-30s，WebSocket 实时推送 <1s
情感分析（LLM 推理）：500ms-2s（取决于模型和 prompt 长度）
信号生成 + 风控校验：100-300ms（规则引擎，非 LLM）
交易执行（API 调用）：50-200ms
端到端： 从新闻发布到交易完成，最快 2-5s（WebSocket + 轻量模型），典型场景 10-30s（含 LLM 深度分析）。关键优化：用小模型做快速初筛，只有高置信度信号才走大模型深度分析，避免所有新闻都走重链路。

8.分析为何大家都在用 multi-agent？原因是什么？从一开始到现在原因是否有变化？使用多 agent 的意义是啥？

早期原因（2023）： 单 Agent 能力有限——上下文窗口小（4K-8K）、工具调用不稳定、推理能力弱。拆成多个 Agent 是"能力不足的变通方案"——每个 Agent 负责更小的子任务，降低单次推理的复杂度。
现在的原因（2025）： 模型能力大幅提升（200K 窗口、稳定工具调用），但 multi-agent 依然流行，原因变了：
上下文隔离：不同子任务的中间状态互相干扰是实际痛点，隔离后每个 Agent 的推理质量更高
专业化分工：每个 Agent 的 System Prompt 和工具集针对性更强，比"一个全能 Agent"更稳定
并行提速：独立子任务并行执行，总延迟 = 最慢的那个 Agent
可观测性：每个 Agent 的行为可独立追踪和调试，出了问题能精准定位
本质变化： 从"能力不足的补丁"变成了"工程最佳实践"。就像微服务不是因为单体"不能跑"，而是因为分开更好管。

9.Multi-agent 如何通信？在不同的项目中分别使用了哪些通信方法？Claude Code、Codex、OpenClaw、Hermes Agent 以及大厂自己开发的 multi-agent 是如何协作完成任务的？

通信方式分类：

结构化消息传递	JSON 消息体带 task_id/role/payload	OpenAI Agents SDK (Handoff)、大厂内部方案
共享状态黑板	中央 State Store，Agent 订阅/写入	LangGraph（State 对象）、AutoGen
文件系统中继	通过 .md 文件 / git 传递上下文	Claude Code（ CLAUDE.md + Memory）、Codex
事件驱动	Pub/Sub 模式，Agent 监听事件触发	Hermes、企业级 Agent 编排
函数调用委托	主 Agent 直接调用子 Agent 作为"工具"	Claude Code（Agent tool）、OpenClaw
开放协议（A2A）	Agent Card 发现 + Task 生命周期 + JSON-RPC	Google A2A Protocol

协议层次区分（MCP vs A2A）：
MCP（Model Context Protocol）：解决 Agent → 工具/资源的连接，类比 USB 接口接外设
A2A（Agent-to-Agent Protocol）：解决 Agent → Agent 的跨框架互操作，类比 HTTP 让不同服务互相调用
两者协同：A2A 负责水平通信（Agent 间委托任务），MCP 负责垂直连接（Agent 调工具）
A2A 核心设计：Agent Card（/.well-known/agent.json 声明能力）→ Task 生命周期（submitted→working→completed）→ 支持多轮交互和长时间运行任务

具体项目对比：
Claude Code：主 Agent 通过 Agent tool 派发子任务（prompt 即通信协议），子 Agent 返回结构化结果。上下文隔离靠独立对话窗口，持久化靠 Memory 文件
Codex：多 Agent 通过 git worktree 隔离工作空间，通信靠 PR/commit message，适合并行开发
OpenClaw：分层压缩记忆 + .md 文件作为 human-in-the-loop 审查接口，Agent 间通过事件触发流转
Hermes：情景记忆（Episodic Memory）+ 双索引（语义+时间），Agent 间通过事件关联度匹配触发
大厂方案：通常是中心化 Orchestrator + 结构化消息总线，用状态机管理流转，强调可观测性和审计

10.智能客服长上下文不够用怎么办？agent 压缩机制有哪些？分析优劣。在面向客户使用时如何实现 multi-agent 并且实现用户体验良好？

压缩机制对比：

滑动窗口截断	只保留最近 N 轮	简单、零额外成本	丢失早期关键信息
摘要压缩	LLM 定期把历史压缩成摘要	保留语义、释放 70%+ token	摘要可能丢细节、额外 LLM 调用
关键信息外置	提取实体/约束存独立 state，每轮注入	关键信息不丢、最可靠	需要 NER 提取逻辑
分话题记忆	按话题分段，只加载当前话题的完整记忆	话题切换时体验好	话题检测准确率是瓶颈
子任务拆分	复杂任务拆成独立子对话，结果通过数据库传递	每个子任务上下文干净	用户感知到"被转接"

面向客户的 multi-agent 体验设计：
核心原则：用户感知到的是一个客服，背后是多个 Agent 协作。
统一对话界面：用户始终在一个对话窗口中，Agent 切换对用户透明。用 Orchestrator Agent 管理路由，用户只和 Orchestrator 对话
Handoff 时传结论不传过程：Agent A 转给 Agent B 时，传结构化摘要（用户需求 + 已确认信息 + 待处理事项），不传原始对话历史。避免 B 重复问用户已经说过的信息
追问策略：不让用户做填空题，让用户做选择题。"您是想查物流还是申请退款？"而不是"请问您有什么需求？"
状态感知：每个 Agent 接手时，先用一句话确认已知信息——"我看到您要退货的是订单 XXX，对吗？"让用户觉得"它记得我说过的话"
降级兜底：Agent 连续 2 次无法理解用户 → 自动升级到人工，附带完整上下文摘要，让人工客服无缝接续

11.知识库 RAG 和智能客服 agent 系统的成熟方案、标准方案以及优点局限性？

标准方案架构：
用户输入 → 意图识别/路由 → RAG 检索（向量+BM25混合）→ Rerank 精排 → LLM 生成回答 → 答案校验 → 输出
成熟方案对比：

纯 RAG 问答	大多数企业知识库	简单、可追溯、成本低	不能处理多轮复杂任务、无法执行操作
RAG + Agent	Coze、Dify、FastGPT	既能查知识又能调工具执行操作	工具调用准确率不稳定、调试困难
Multi-Agent 客服	蚂蚁/阿里内部方案	专业分工、可扩展、体验好	架构复杂、通信成本高、需要大量领域数据
知识图谱 + RAG	GraphRAG 方案	多跳推理强、实体消歧好	图构建成本高（大量 LLM 调用）、维护复杂

标准方案的核心局限性：
知识库覆盖度：用户问了知识库没有的问题 → 模型要么幻觉要么拒答，体验都不好
多轮上下文管理：标准 RAG 是单轮检索，多轮对话中上下文漂移导致检索偏离
个性化不足：同一个问题对不同用户应该有不同回答（VIP vs 普通用户），标准方案不区分
实时性：知识库更新有延迟，新政策/新产品上线后用户马上来问，知识库还没入库

12.GraphRAG 叶子节点在智能客服中如何触发？

GraphRAG 的图结构：
根节点（全局主题摘要）
├── 社区节点（主题簇摘要）
│ ├── 实体节点（具体实体）
│ │ └── 叶子节点（原始文档 chunk / 三元组细节）
│ └── 实体节点
└── 社区节点
叶子节点触发机制：
GraphRAG 有两种搜索模式：
Global Search：从社区摘要出发，适合全局性问题（"你们的退货政策整体是什么"）→ 不触达叶子节点
Local Search：从具体实体出发，沿关系边遍历到叶子节点，适合具体细节问题
智能客服中的触发条件：
当用户问题涉及具体实体的细节信息时触发叶子节点检索：
实体识别：从用户 query 中提取具体实体（产品名、订单号、功能名）
图定位：在知识图谱中定位到该实体节点
关系遍历：沿实体的关系边向下遍历到叶子节点（原始文档片段、具体参数、操作步骤）
上下文聚合：收集叶子节点内容 + 沿途实体关系 + 所属社区摘要，组合成完整上下文
触发 vs 不触发的判断：
"你们有什么售后服务"
Global
否，社区摘要足够
"iPhone 15 能不能 7 天无理由退"
Local
是，需要具体产品的退货规则细节
"我的订单 123456 什么时候到"
Local + API
是，且需要调用外部系统
工程实现要点： 用意图分类器判断问题粒度——粗粒度走 Global（快但粗），细粒度走 Local 到叶子节点（慢但准）。两者可以级联：先 Global 判断主题范围，再 Local 深入到具体细节。

面试感受

整体偏考察 Agent 工程实践和多 Agent 系统设计能力
对 Vibe Coding / Claude Code 开发流程问得很细，建议提前准备好项目的 git 历史和 CLAUDE.md 演进过程
Multi-agent 通信和智能客服是重点考察方向，需要对比不同项目的实现差异
算法手撕是 Hard 难度，建议刷熟滑动窗口模板

#聊聊我眼中的AI##发面经攒人品##这些公司卡简历很严格##AI求职记录#

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

可以的，总结的很好呀

点赞回复分享

发布于昨天 23:00 北京

在下uptown

山东大学 Java

Binance面AI岗，这赛道卷得飞起

点赞回复分享

发布于昨天 13:43 台湾

不愿透露姓名的神秘牛友

05-11 16:39

偷了同事简历，有字节暑实面试了

说出来挺羞耻的。我隔壁工位那哥们儿是26届正职，简历贼牛，进过两家大厂实习。前两天他电脑没锁就去吃饭了，简历文件就摊在桌面上。我鬼使神差点开看了一眼，看完心态崩了——同样是项目经历，人家写得跟拆弹一样有节奏，我写得跟流水账似的。也是最近投实习一直没反馈，我真是投急眼了，也没想就回去把他那套框架照搬了，STAR结构、量化数据、技术选型动机一个不落。当然项目是我自己的，就模仿了下表达方式。投了五家，今天2家大厂HR打电话约我下周面试，说简历写得很清晰。我也不知道该高兴还是该羞愧。一边想着这算不算抄，一边又想，求职这事儿不就是信息差吗，他大四能进大厂凭啥我不能学。晚上请他喝奶茶了，他还问我最近咋这么客气。哥，对不住

云边有个offer：恭喜啊！希望你能得到offer，然后公开简历模版让我们看借鉴借鉴🤣

点赞评论收藏

05-10 00:11

腾讯_Android客户端开发

哈啰安卓二面

自我介绍快手实习没有转正的原因是什么？快手实习期间整理手机厂商能力文档的具体流程是什么？反编译抖音源码后，如何将调研信息同步给团队？智能音量调节需求中，给算法团队提供的数据包含哪些内容？低端机性能测试的具体操作流程是什么？低端机卡顿率波动的原因是什么？对应的优化策略有哪些？不同类型的作品卡片对快手 APP 性能有影响吗？从后端开发转向客户端开发的原因是什么？如何看待大前端趋势下需要掌握多种技术栈的情况？循环链表和队列的区别是什么？循环链表和队列的适用场景分别是什么？海量数据场景下，优先选择队列还是循环链表？为什么？进程间的通信方式有哪些？各种进程通信方式中，性能最高的是哪种？最安全的是哪种？你...

查看20道真题和解析

点赞评论收藏

05-13 15:48

吉首大学后端工程师

猎豹移动Agent全栈开发面经（40min，忘记录了，但是还记得一些面经）

1. 你对Graph和DAG框架有什么理解？2. 有向无环图（DAG）与含循环图（如循环RAG）的区别是什么？3. 有向无环图（DAG）适合什么场景？含循环图（如循环RAG）适合什么场景？4. 针对“每日自动分析并编排工作计划”的需求，该如何设计架构？是否需要结合循环RAG架构与短期记忆机制？5. 对于“每日自动分析并编排工作计划”的需求，应将能力沉淀为Skill还是长期记忆以实现持久化？6. Multi-Agent编排中，可能会出现死循环或Agent间推诿的问题，该如何监控与规避？7. 长流程中大模型输出被截断（如代码/文档不完整），有哪些工程化的解决手段？8. 从Prompt层面，如何解决大模型输出被截断的问题？（如few-shot示例、自校验机制）9. 从代码层面，如何解决大模型输出被截断的问题？（如重试逻辑、后处理清洗）10. MCP与Skill的区别是什么？11. 怎么设计一个大模型网关系统？12. 大模型未来在Skill能力上的发展趋势是什么？13. 请说说你的项目参赛经历，以及你在团队中担任的角色（如小队长）和具体负责的工作？14. 你是否考虑将参与的项目转化为创业方向？15. 你的毕业时间是什么时候？16. 你目前的状态是什么？（如全职实习）17. 大四是否还有课程？后续返校需要完成哪些事宜？

查看17道真题和解析

点赞评论收藏

04-16 08:57

广西大学算法工程师

蚂蚁 AI应用开发二面

1. 实习拷打2. AI Coding 的笔试如果只是人工造 case 去测，你觉得它离生产可交付还差什么人工造 case 只能验证“在已知分布上能不能过样例”，离生产可交付还差三层。第一层是任务边界，要明确输入约束、输出格式、失败语义和回滚策略，不然模型生成的内容没法进入真实工作流。第二层是稳定性，要知道不同仓库规模、不同语言、不同依赖环境下性能会不会抖。第三层是验收能力，必须补静态检查、单测、sandbox 执行、diff 审核和回归评估。没有这些，AI Coding 最多是演示能力，不是工程能力。 def validate_patch(patch, repo_path): if not ...

AI-Agent面试实战...

点赞评论收藏

05-13 16:45

门头沟学院推荐算法

我问豆包：字节强度大不大

很好，很诚实，表扬了。我会考虑为你付费的😂

Data_Seven：它有没有稳稳的接住你

点赞评论收藏

招聘动态

完美世界

拍了拍你并邀请你投递

“联宝杯”

2026 大学生创新大赛

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

联想

26届补录

27届校招宝典

快手

27届实习超多转正机会

联想

2026届校园招聘

海信集团

联宝科技

全站热榜

创作者周榜

正在热议

# 总结:offer选择，我是怎么选的 #

297549次浏览 1596人参与

# AI让海力士市值突破9000亿美元 #

"你们有什么售后服务"	Global	否，社区摘要足够
"iPhone 15 能不能 7 天无理由退"	Local	是，需要具体产品的退货规则细节
"我的订单 123456 什么时候到"	Local + API	是，且需要调用外部系统