DeepSpeed v0.18.8 发布:稳定性、Evoformer、多架构构建与ZeRO优化全面升

DeepSpeed v0.18.8 发布:稳定性、Evoformer、多架构构建与ZeRO优化全面升级详解

1. 基本信息
• 版本号:v0.18.8
• 发布时间:2026 年 3 月 13 日
• 版本类型:Patch Release(补丁版本)
2. 核心更新方向总结
本次 v0.18.8 主要聚焦以下几个方面:

• 日志与内存监控优化:减少无意义的日志噪音
• Evoformer Attention 多架构构建修复:解决编译与调度根因
• FP16 loss_scale 校验增强:避免隐性训练错误
• ZeRO Stage1/2/3 稳定性改进:CUDA stream 与日志行为修复
• Bloom 模型推理测试修复
• 华为 Ascend NPU Async IO 构建问题修复
• AI 编码代理项目规范新增
• 测试覆盖增强
• 版本号更新
#大模型# #福大大架构师每日一题#
全部评论

相关推荐

03-17 23:54
黑龙江大学 Java
来个白菜也好啊qaq:可以的,大厂有的缺打手
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务