第 38 题:Agent 中的探索 vs 利用(Exploration vs Exploitatio

第 38 题:Agent 中的探索 vs 利用(Exploration vs Exploitation)权衡

题目

解释 Agent 中的探索 vs 利用(Exploration vs Exploitation)权衡。

一、概念来源与含义

探索(Exploration):尝试不确定的动作或策略,以获取新信息、发现更好方案——如尝试新工具、新参数、新推理路径。
利用(Exploitation):基于当前已知选择认为最优的动作——如反复使用已见效的工具与策略。

二者存在权衡:过度利用会陷入局部最优、错过更优解;过度探索会浪费资源、延迟完成任务。在 RL、多臂老虎机与 Agent 决策中都需要平衡。

二、在 Agent 中的体现

  • 工具与 API 选择:总是用“最熟”的 API(利用)vs 偶尔尝试新 API 或新用法(探索),以发现更合适或更全的能力。
  • 推理与规划:总用同一类推理链(利用)vs 尝试不同分解方式、不同 CoT 路径(探索),以找到更短或更稳的解法。

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

Ai Agent:面试300问 文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造,适配校招、社招全场景,覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题,全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域,拆解考点底层逻辑,分享一线实战经验,助你一站式通关高薪面试。

全部评论

相关推荐

点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务