1、为什么决定选用RAG这个技术框架?2、为什么要用向量检索(RAG)?不用其他方式?3、Transformer中Attention的本质是什么?4、SFT的核心流程有哪些,SFT之后常见的Post- Training有哪些?5、如果让你设计一个多轮对话的Agent,你认为纯 Attention结构在处理长时间对话时,会遇到哪些瓶颈?6、什么是RAG,为什么没选向量库?7、现在给你一个RAG系统,你怎么设计一套评估方案来判断它‘好用’?8、你用的切分策略是什么?9、Prompt自动推荐模块用了哪些优化策略?有没有尝试过Prompt压缩或embedding表示的方式?10、在做对齐时,PPO和DPO你更倾向于用哪个? 有什么区别?11、假如一个Agent推理链路包含3个工具+高频请求,系统整体延迟较高,你会如何优化?