字节大模型Agent算法二面-秋招面经

1.介绍下self-attention,计算其时间复杂度。
2.为什么要用multi-head attention?
3.PPO的clip机制?在线强化学习和离线强化学习有什么区别?RLHF是哪一种?
4.为什么要用reference model? 为了解决什么问题?
5.如何让多个agent协同工作的?举个具体的协同机制例子。
6.如果一个agent误判导致策略冲突,如何处理?
7.有没有用到类似AutoGen或LangChain的框架?为什么选这个框架?
8.你是怎么设计agent的记忆系统?
9.长期记忆如何存储?如果历史记录量非常大,怎么优化查询效率?
10.有没有做记忆衰退,避免旧数据干扰新任务?
11.你们这种模块堆叠的架构是怎么设计视觉问答模块和动作模块的协同逻辑的?
12.human feedback是怎么被agent消化吸收的?有没有用rl进行策略更新?
13.有没有做过模型压缩?比如在车载端或低端设备上的推理加速?
14.如果量化后理解能力下降怎么办?怎么做精度补偿?
15.你怎么处理响应速度与推理精度之间的tradeoff?是先召回再精排,还是单次生成?
16.如果要做电商agent,你会选择哪些模态的信息作为输入?比如文本评论、图像、视频、购买记录?
全部评论
没有手撕吗
点赞 回复 分享
发布于 2025-12-19 15:36 江苏

相关推荐

1.你的 Agent 系统Prompt 是怎么设计和迭代的?有没有做过 Prompt 自动优化?当用户提出不完整的请求时,如何补全用户意图的?2.构建 Agent 的时候,遇到过哪些瓶颈?LangChain 的 memory 默认机制在多3.用户并发中怎么做隔离?你是如何保证线程安全的?4.微调 Llama2 你是怎么选择训练样本的?清洗逻辑是什么?你有没有观察到哪些训练样本质量问题对模型行为有很大影响?举例说明。5.DPO相比 SFT,有哪些优劣?它在 Agent 任务上效果提升明显吗?你怎么构造偏好对?构造逻辑是自动的还是人工?6.你说你服务部署在 vLLM 上,为何选择它?KV-cache 如何帮助推理加速?你自己做过哪些优化?7.假如需要支持 Streaming 输出,但当前服务延迟又超标,你会怎么折中设计?8.多轮对话上下文状态管理是如何做的?如何在高并发场景下保证一致性?9.你做的 Agent 使用了多少个外部工具,在调用链条上如何保障故障容错和超时机制?10.有没有做过工具调用失败后的feedback策略设计?11.训练过程中数据来自用户行为日志,你是如何从这些数据中抽取训练对话的?有没有做过归一化或事件抽象?12.有没有了解过带有时间窗口/偏移限制的对话系统?模型怎么“理解时间”?13.你觉得 Agent 哪些模块最容易在真实业务中出问题?你会如何监控和定位的?
点赞 评论 收藏
分享
2025-12-08 16:41
已编辑
门头沟学院 前端工程师
虽然但是还是有点点受挫,身边的好多学长学姐现在都在大厂,甚至有同28不同方向的已经有一段实习了,自己还连一段实习都没感觉还是要多努力学习学习,有面试已经是很好的开端啦愿好运常伴我身timeline12.4 要简历约面12.6 一面12.8 询问面试反馈,说没过,给了面试评价和建议,公司给我的印象真的很好 TvT 继续努力✊一面面试官是个女孩子,特别特别特别的友好,虽然说是第二次面试,但是在面试前还是很紧张的,面试官一直是笑着的,让我觉得很放松 TvT,总的来说八股问的比较多,一般是根据你的回答进行追问1. 自我介绍2. Medule Federation 对于 monorepo 的优化体现在哪?3. 说说 cdn4. 打开一个网页的过程5. 说说布局和绘制6. 还有什么会影响布局7. 虚拟列表原理8. 把列表换成树怎么做(不会 TvT9. JS 异步的实现10. 对于计算量比较大的任务可以怎么做11. webWorker 缺点?(没答出来12. 说说闭包和作用域13. 闭包和垃圾回收机制14. 怎么清楚闭包中的变量15. 垃圾回收机制什么时候触发16. nodejs 内置的模块(没答出来17. 问了一下学校什么课程18. 问问数据结构的,数组和链表的区别(没答出来 TvT,私密马赛 sansei19. 用什么打包?20. Vite 的配置你是默认的还是会自己去配置21. 组件库按需导入怎么实现的22. 为什么还要配置 umd 导出23. 说说 umd,amd,cjs,esm 的区别24. 说说你的 LLM 的项目25. 怎么管理对话上下文的?26. 说说 sse,为什么用 sse,和 webscoket 区别27. websocket 用过吗?(没有28. sse 是怎么实现的29. 把你知道的前端性能优化方面说说30. 什么会导致 React 组件重复渲染31. 说说怎么减少不必要的渲染32. 说说浏览器的缓存33. http 的版本有什么区别反问1. 公司业务(面试官好耐心的跟我说了好久,业务有 agent 平台,PRA 还有 web 端客户端之类的2. 实习生会有人带吗3. 面试反馈什么时候出4. 觉得我答得怎么样(答的都挺全面的,但是还是有些深入的东西不是很熟,比如说为什么啊之类的,但是我们不能以工作好几年的要求来要求还没工作过的你嘛
点赞 评论 收藏
分享
评论
1
12
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务