1.和传统SFT相比,RLHF旨在解决语言模型中的哪些核心问题?2.在Agent的设计中,“规划能力”至关重要。请谈谈目前有哪些主流方法可以赋予LLM规划能力?(例如CoT, ToT, GoT*)3.什么是多智能体系统?让多个LLM Agent协同工作相比于单个Agent有什么优势?又会引入哪些新的复杂性?4.你用过哪些Agent框架?选型是如何选的?你最终场景的评价指标是什么?5.你简历中的客服Agent项目,是如何判断用户意图是否需要调用外部API的?用了分类模型还是prompt判断?6.大模型生成工具调用时,如何避免参数格式错误?有哪些后处理或约束解码方法?7.当多个工具都能完成子任务时,你的Agent如何做选择?有没有引入打分或排序模块?8.在Agent中引入“记忆”机制时,为什么常用向量数据库?如何设计embedding和检索策略?9.项目上线后,你是如何收集bad case并迭代模型/策略的?有做在线学习吗?