字节ai agent一面(地狱难度版)

* 为什么在 RAG 流程中引入父子索引(Parent-Document Retrieval)?
* 为什么引入 BM25?向量检索和 BM25 的融合比例是怎样的?
* 检索融合的具体流程是什么?召回后有没有做 Rerank?
* Rerank 后返回几个块(Chunk)?有没有针对这个返回数量做过验证?
* Rerank 后的 TopK 截断是怎么做的?为什么是这个值?有没有其他截断方案?
* 讲一下上下文工程(Context Engineering),Agent 的记忆(Memory)是怎么做的?
* 请详细讲解分布式令牌桶限流的实现。
* 漏桶算法(Leaky Bucket)的原理讲一下。
* 滑动窗口算法限流讲一下。如果用代码实现,滑动窗口的结构体会包含哪些字段?
* 滑动窗口和令牌桶相比有什么缺点?
* 在 Redis 中,你会用什么数据结构来实现滑动窗口限流?
* LRU 缓存的实现原理讲一下。
* 布隆过滤器(Bloom Filter)的底层原理和适用场景讲一下。
* MySQL 索引会在哪些情况下失效?
* 在使用 LIKE 进行模糊查询时,索引什么情况下会失效?
* MySQL 的事务隔离级别有哪些?如何保证一致性?
* 详细说说 MVCC 的实现,ReadView 的生成时机是怎样的?
* 在不同的隔离级别下,一个事务分别会创造几个 ReadView?
* MySQL 都有哪些锁?它们的作用分别是什么?
* 为什么选择 Python 和 Go 作为技术栈?在处理并发时有什么区别?
* 手撕代码:实现反转链表。
问的好杂,后面有的答不上来了是正常的吗 #Agent面试会问什么?#
全部评论
m
点赞 回复 分享
发布于 05-09 23:30 广东
同学拼多多【暑假实习/春招】机会考虑吗?链接见主页,团队氛围好,工作内容挑战性强,转正薪资待遇极具竞争力。可一对一帮查进度,解答过程问题。27实习:https://careers.pddglobalhr.com/campus/intern/detail?t=dcsvrwtijZ
点赞 回复 分享
发布于 05-08 10:02 上海
看着这是问了不少问题啊
点赞 回复 分享
发布于 04-22 12:22 陕西
感觉确实难啊
点赞 回复 分享
发布于 04-12 21:26 北京
答不上是正常的,就是因为你前面都答上来了,才会一直问问到你答不上来,才能知道你强到什么程度
点赞 回复 分享
发布于 04-09 12:04 湖北

相关推荐

05-04 02:30
门头沟学院 Java
攒人品中,祝大家都能拿到满意的Offer!1. 实习经历拷打2. 在调优 Prompt(提示词)时,你有哪些实战经验?如何利用 AI 辅助自己优化 Prompt?3. 谈谈你对 ReAct 模式和 Plan-and-Execute(计划执行)模式的理解及优劣对比。4. 详细描述一下你项目中的 RAG 流程,从文档切块到最终生成的完整步骤是什么?5. 什么是多路检索(Multi-way Retrieval)?向量检索和关键词检索分别解决什么问题?6. 在 RAG 场景中,Re-rank(重排序)的作用是什么?为什么有了向量相似度还需要它?7. RAG 架构与模型参数微调(Fine-tuning)相比,各自的适用场景和优缺点是什么?8. 对于多跳(Multi-hop)推理或复杂的逻辑查询(特指需要多次 RAG),现有的 RAG 架构该如何优化?9. 如何处理 RAG 过程中的权限隔离和时效性问题?比如不同用户只能检索到自己的知识库。10. 简单介绍下 Transformer 的 QKV 机制,以及为什么引入位置编码和多头注意力?11. 深度学习网络中的“残差连接”解决了什么问题?其物理含义是什么?12. 现有的大模型性能为什么这么好?13. Java 反射的原理是什么?它有哪些实际的应用场景?14. 反射在带来灵活性(如 AOP)的同时,在性能和安全性方面有哪些副作用?15. 如何通过反射获取并调用一个类的 private 方法?需要注意哪个关键步骤?16. 场景题:一个每秒 10w QPS 的高并发系统,要求实时输出“最近 1 小时”内访问频率最高的 10 个 IP,你会如何设计?17. 在上述场景中,如何保证统计的实时性?如何处理跨时间窗口的数据过期淘汰?18. 如果该系统是分布式的,数据分散在多个实例,你该如何汇总并得出全局的 Top 10 IP?19. 手撕 :给定一个正整数 n 和一组数字,要求用这组数字中的元素组成一个小于 n 的最大数
查看18道真题和解析
点赞 评论 收藏
分享
评论
7
74
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务