评估 AI,做好上线前的准备
按照传统软件的观念,只要测试 case 都通过,就可以上线。但 AI Agent 不是这样的,它始终是概率事件,输入 A,预期 B,但还是有可能输出 C,D 的。那如何把握住 AI Agent 项目的质量呢?
测概率而不是结果!
找测试边界,bad case,多生成几百条。结果或许并准确率不高,那就通知下个环节去调整 Prompt,workflow 等。
你把这项能力学会,写在简历上,很亮眼
#简历上如何体现你的“AI”能力?#
测概率而不是结果!
找测试边界,bad case,多生成几百条。结果或许并准确率不高,那就通知下个环节去调整 Prompt,workflow 等。
你把这项能力学会,写在简历上,很亮眼
#简历上如何体现你的“AI”能力?#
全部评论
相关推荐
点赞 评论 收藏
分享
查看21道真题和解析