淘天大模型Agent校招面经

1、为什么决定选用RAG这个技术框架?
2、为什么要用向量检索(RAG)?不用其他方式?  
3、Transformer中Attention的本质是什么?  
4、SFT的核心流程有哪些,SFT之后常见的Post- Training有哪些?  
5、如果让你设计一个多轮对话的Agent,你认为纯 Attention结构在处理长时间对话时,会遇到哪些瓶颈?  
6、什么是RAG,为什么没选向量库?
7、现在给你一个RAG系统,你怎么设计一套评估方案来判断它‘好用’?  
8、你用的切分策略是什么?  
9、Prompt自动推荐模块用了哪些优化策略?有没有尝试过Prompt压缩或embedding表示的方式?  
10、在做对齐时,PPO和DPO你更倾向于用哪个? 有什么区别?  
11、假如一个Agent推理链路包含3个工具+高频请求,系统整体延迟较高,你会如何优化? #Agent面试会问什么?#
全部评论

相关推荐

04-09 15:35
门头沟学院 Java
一、团队与工作相关你最近这段实习,开发团队规模大概是怎样的?你在工作里会直接面对客户需求吗?二、DeepResearch 项目细节DeepResearch 项目中,你主要负责哪些模块?项目中为何设计 6 个 Agent?每个 Agent 分别负责什么职责?搜索环节具体如何实现?采用的是 Function Calling、MCP 还是 RAG 方案?联网搜索功能是怎么实现的?该模块是否由你主导开发?共享状态 ResearchState 包含哪些核心字段?区分哪些是全局共享内容,哪些是阶段性产物。工作流 Graph 中,节点之间是如何进行路由调度的?三、技术实现与工程能力你做的步骤级 SSE 推送,和普通 Token 流式输出有什么本质差异?若通信中途断连,系统如何实现恢复?Checkpoint 存储为什么选择 PostgreSQL JSONB,而不使用 Redis 或分表存储?RAG 系统中,chunk size 和 top_k 参数的实验是如何具体设计与开展的?测试数据集主要从哪些渠道获取?测试集的量级大概是多少?多模型选型中,为何选择 DeepSeek 和干问?具体的选型标准是什么?“成本优先” 的选型策略是由谁提出的?四、Agent 架构与策略OnCall 项目中,为何对话场景选用 ReAct 模式,运维场景选用 Plan-Execute-Replan 模式?MCP 具体暴露了哪些工具接口?MCP 调用失败,或模型错误调用工具时,系统是如何处理的?五、记忆与项目复盘多轮记忆体系中,短期记忆具体存储哪些内容?参与过的项目中,有没有你最想重构的部分?原因是什么?平时最常用的 AI Coding 工具是什么?
查看22道真题和解析
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务