1.自我介绍 2.讲一下你的自动化评估体系是怎么设计的吧 3. markdown转html做报告验证,那你这个合法性是怎么判断合法的?是直接看渲染结果吗?那怎么做自动验证的? 4.你说截图验证,那你这个截图是怎么生成的?怎么知道截图渲染的是正确的 5. Agent 推荐比赛的提示词优化流程讲一下,是怎么构造出更优提示词的 6.你这个提示词优化迭代里面,比如说你怎么判断当前生成提示词就是“最优 7. 刚刚说“反思机制”有个模块,那我想问问这个反思机制是怎么做的?是类似 Chain of Thought 吗?有没有自动修正能力? 8.帮我实现一下Transformer 里面的多头注意力你能现场实现...