第 29 题:HuggingGPT / JARVIS 的架构设计思想

第 29 题:HuggingGPT / JARVIS 的架构设计思想

题目

解释 HuggingGPT/JARVIS 的架构设计思想。

一、核心思想(一句话)

HuggingGPT(JARVIS)LLM 作为“总控”:负责任务规划(把用户请求拆成子任务)、模型/工具选择(为每个子任务选合适的 Hugging Face 模型或工具)、调度与结果融合(按依赖执行、把子结果汇总成最终回复)。即“LLM 当大脑,外部模型与工具当手脚”,实现多模态、多模型协作的 Agent。

二、架构要点

  • 任务规划:用户输入 → LLM 生成任务列表(如 1. 图像描述 2. 情感分析 3. 生成摘要),并标出依赖(如 2 依赖 1 的输出)。
  • 模型/工具选择:对每个子任务,LLM 从可用模型与工具库(如 Hugging Face 上的模型、API)中选出合适的,并给出调用方式与输入来源(上一任务输出或用户输入)。
  • 调度执行:按依赖 DAG 执行——无依赖的先跑,有依赖的等前置完成再跑;调用所选模型/API,收集输出。
  • 结果融合:所有子任务结果汇总给 LLM,由 LLM 生成最终自然语言回复,统一呈现给用户。

数据流:用户请

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

Ai Agent:面试300问 文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造,适配校招、社招全场景,覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题,全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域,拆解考点底层逻辑,分享一线实战经验,助你一站式通关高薪面试。

全部评论
评论
点赞
收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务