字节 ai agent 一面分享 攒人品

给我面没招了,发点面经攒攒人品~
1* 为什么引入 BM25?向量检索和 BM25 的融合比例是怎样的?
2* 检索融合的具体流程是什么?召回后有没有做 Rerank?
3* Rerank 后返回几个块(Chunk)?有没有针对这个返回数量做过验证?
4* Rerank 后的 TopK 截断是怎么做的?为什么是这个值?有没有其他截断方案?
5* 讲一下上下文工程(Context Engineering),Agent 的记忆(Memory)是怎么做的?
6* 请详细讲解分布式令牌桶限流的实现。
7* 漏桶算法(Leaky Bucket)的原理讲一下。
8* 滑动窗口算法限流讲一下。如果用代码实现,滑动窗口的结构体会包含哪些字段?
9* 滑动窗口和令牌桶相比有什么缺点?
10* 在 Redis 中,你会用什么数据结构来实现滑动窗口限流?
11* LRU 缓存的实现原理讲一下。
12* 布隆过滤器(Bloom Filter)的底层原理和适用场景讲一下。
13* MySQL 索引会在哪些情况下失效?
14* 在使用 LIKE 进行模糊查询时,索引什么情况下会失效?
15* MySQL 的事务隔离级别有哪些?如何保证一致性?
16* 详细说说 MVCC 的实现,ReadView 的生成时机是怎样的?
17* 在不同的隔离级别下,一个事务分别会创造几个 ReadView?
全部评论
大佬,为什么面agent也会问java后端的这些东西
1 回复 分享
发布于 04-07 15:08 安徽
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 04-03 10:00 广东
是飞书吗
点赞 回复 分享
发布于 04-03 18:23 广东
Chunk数量验证过吗
点赞 回复 分享
发布于 04-03 10:49 北京

相关推荐

好难,分享面经攒人品。· 在Agent知识闭环中,如何设计决定哪些信息进入向量数据库(长期记忆)、哪些进入上下文窗口(短期记忆)、哪些直接转化为模型权重的元记忆?· 当对话轮数较多且上下文窗口严重不足时,如何在不丢失初始Attention Sink的前提下保持生成的连贯性?· 详细讲讲你设计的Agent是如何实现的?在“推理-行动”循环中,如何设计来纠正逻辑塌缩或无效工具调用?· MCP与传统Agent Skills的区别是什么?如何实现在多智能体环境中动态发现并注册跨协议工具?· 在电商或导购场景下,用户的请求往往高度模糊,Agent如何精准理解这种需求?· 如何设计一套“主动澄清”决策逻辑?什么情况下Agent应该反问用户,什么情况下应该结合历史画像强行推断?· 针对包含3个以上工具调用且高频请求的任务,通过什么方式可以压低系统整体的端到端延迟?· 如何衡量Agent的Planning能力 vs Hallucination Rate?请列举具体的量化评估指标或自动化评估框架。· 在多Agent协作系统中,不同Agent之间的记忆如何实现隔离与共享?如何避免不同工具间的上下文污染?· Token过长导致的Attention稀释现象为什么会导致Agent的指令遵循能力下降?· 摘要总结往往会丢失关键细节,在长文本Agent中一般怎么处理这一块?· 当候选工具超过100个时,如何设计路由策略?怎么解决检索过程中的召回偏差?· 在Agent多轮对话任务中,标准Attention机制的平方复杂度在工程落地主要引发了哪些问题?· 目前有哪些机制可以缓解模型在上下文对话里的“信息遗忘”现象?当对话轮数很多、上下文窗口不够时,有哪些处理策略?· 为什么在复杂的Agent闭环场景中,仅靠RAG无法彻底解决幻觉问题?模型幻觉在电商这种强事实性场景里怎么治理?这个问题很现实。比如用户咨询某款运动鞋:“这款鞋参加今晚的‘满300减50’活动吗?”如果模型产生幻觉,随口答复,而实际该品牌属于不参加活动的黑名单商家。一旦用户下单后发现没减钱,就会产生大规模的退货和客诉。· 面对模型在Agent执行过程中出现的循环调用或陷入思维死循环问题,有哪些解决方法?· GraphRAG在处理Agent复杂关联查询时的优势在哪里?· 任务执行远大于单次Token限制时,如何设计以支持断点继续生成?· 设计一个智能导购助手Agent?描述其感知、规划、记忆和执行四大模块在分布式架构下的协同逻辑。
查看19道真题和解析
点赞 评论 收藏
分享
评论
3
24
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务