ollama v0.21.1发布:Kimi CLI原生集成、MLX推理性能飞跃、多模态长程任务能力全
ollama v0.21.1发布:Kimi CLI原生集成、MLX推理性能飞跃、多模态长程任务能力全面进化
Ollama v0.21.1 版本的更新覆盖范围广泛,涉及命令行工具、模型管理、推理引擎、API 接口、文档等多个模块,具体可分为以下几大板块:
• 新增 Kimi Code CLI 集成,支持自动安装、配置与运行,实现 Moonshot coding agent 与 Ollama 模型的无缝联动;
• MLX Runner 全面优化,包括采样器重构、张量管理线程安全优化、推理管道优化、logprobs 支持完善等;
• 模型推荐与管理优化,更新推荐模型列表,调整模型排序规则,完善云模型上下文长度限制;
• Hermes Agent 文档重构,优化快速启动流程,调整推荐模型说明,简化配置步骤;
• API 接口修复,解决 gemma4 模型在禁用 thinking 时格式约束失效的问题,完善 logprobs 相关接口;
• 模型相关优化,包括 gemma4、glm4_moe_lite 等模型的细节修复与功能完善。
本次更新不涉及新增功能模块,全部围绕现有功能的优化与完善展开,重点解决了此前版本中存在的性能瓶颈、功能缺陷与体验痛点,尤其针对 MLX 推理引擎的优化,让搭载 Apple Silicon 芯片的设备运行本地模型时获得更出色的性能表现。
#大模型# #福大大架构师每日一题#
Ollama v0.21.1 版本的更新覆盖范围广泛,涉及命令行工具、模型管理、推理引擎、API 接口、文档等多个模块,具体可分为以下几大板块:
• 新增 Kimi Code CLI 集成,支持自动安装、配置与运行,实现 Moonshot coding agent 与 Ollama 模型的无缝联动;
• MLX Runner 全面优化,包括采样器重构、张量管理线程安全优化、推理管道优化、logprobs 支持完善等;
• 模型推荐与管理优化,更新推荐模型列表,调整模型排序规则,完善云模型上下文长度限制;
• Hermes Agent 文档重构,优化快速启动流程,调整推荐模型说明,简化配置步骤;
• API 接口修复,解决 gemma4 模型在禁用 thinking 时格式约束失效的问题,完善 logprobs 相关接口;
• 模型相关优化,包括 gemma4、glm4_moe_lite 等模型的细节修复与功能完善。
本次更新不涉及新增功能模块,全部围绕现有功能的优化与完善展开,重点解决了此前版本中存在的性能瓶颈、功能缺陷与体验痛点,尤其针对 MLX 推理引擎的优化,让搭载 Apple Silicon 芯片的设备运行本地模型时获得更出色的性能表现。
#大模型# #福大大架构师每日一题#
全部评论
相关推荐
05-12 17:53
杭州电子科技大学 运营 点赞 评论 收藏
分享
04-14 16:17
保定学院 软件测试 点赞 评论 收藏
分享
05-12 21:10
暨南大学 嵌入式软件开发 点赞 评论 收藏
分享
