如果你最近关注AI Agent,会发现大家好像都在做Agent了,而且功能越来越多,场景越来越复杂。但一个很现实的问题也开始出现——这些Agent到底做得好不好?差在哪?还能怎么优化?很多时候,这件事不能仅仅肉眼看出来的。今天这个AI Agent评测工程师就在解决这个问题。相比“做Agent”,它更关注的是另一件事:如何系统性地评估一个Agent的能力,并用结果反过来驱动产品迭代。一天一个AI岗位介绍,今天我们来看看AI Agent测评工程师。🧩 主要工作内容:给Agent建立一套“可量化的评价体系”从JD来看,这个岗位的核心并不是开发功能,而是围绕“评测”做一整套体系建设。但这里的“评测”...