1.比较一下几种常见的LLM架构,例如Encoder-0nly, Decoder-Only 和 Encoder-Decoder,并说明它们各自最擅长的任务类型。2.ReAct框架的核心思想是什么?为什么它比纯prompting在复杂任务上表现更好?3.Function Calling 和 Toolformer 的本质区别是什么?各自在训练/推理阶段如何工作?4.如果让你设计一个能行程规划的旅行Agent,你会如何拆解任务?各子Agent职责怎么划分?5.你的Agent如何处理工具调用失败(如API超时、返回空)?有设计重试、降级或用户澄清机制吗?6.在真实场景中,如何防止Agent泄露用户隐私或越权操作?从算法和系统层面谈谈你的设计。7.如果用户连续追问“为什么选这家酒店?”,Agent如何回溯决策链并给出可解释理由?8.如何评估一个Agent系统的鲁棒性?除了准确率,还会测试哪些对抗性或边缘case?