福大大架构师每日一题 - 个人主页动态

今天 05:58

DeepSpeed v0.18.6发布：修复关键并发问题，全面支持Python 3.14，性能更稳定

DeepSpeed v0.18.6发布：修复关键并发问题，全面支持Python 3.14，性能更稳定更智能！✅ 版本号更新版本文件已同步到 0.18.6，确保用户可以准确获取最新版本信息，版本管理更加规范。⚙️ 并发与模块优化本次更新修复了 leaf 模块的竞态条件问题，进一步提升了模型在高并发环境下的稳定性。同时，这意味着在分布式训练过程中，模块之间的同步与数据安全性得到了更好保障。🧠 推理阶段优化在 模型评估（eval） 阶段，系统将 跳过序列并行操作，显著减少无效计算，进一步优化了推理效率。这一改动对大模型推理特别友好，尤其是资源有限的推理部署场景。🔧 AutoTP智能分区增强此次版本还新增了 AutoTP的自定义分区模式支持，并修复了 AutoTP自定义模式中未正确遵循use_default_specs参数 的问题。这让用户能够更加灵活地定义Tensor分区策略，从而在不同硬件架构下获得最优性能表现。📈 训练稳定性改进修复了 Gradient is ready with z2 的梯度计算问题，并修正了 在ZeRO stage 0配置下，bf16梯度范数发散的问题，显著提升了混合精度训练的收敛稳定性。这对使用ZeRO优化的超大模型训练尤为关键。🧩 Python 3.14兼容性更新DeepSpeed v0.18.6全面 支持Python 3.14的新注解处理机制，为未来Python版本的适配铺平道路，开发者可放心升级Python环境。🧮 函数库更新用 math.gcd 替代了已弃用的 fractions.gcd，保持代码兼容性与标准化，确保长远维护更轻松。⚡ 性能改进：JIT替换为编译模式本次更新将 torch.jit.script 替换为 torch.compile，充分利用PyTorch新一代的编译优化能力，提升执行效率的同时简化模型编译部署流程。

0 点赞评论收藏

昨天 00:25

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.16.1发布：安装体验优化、模型加载超时可配置、图像生成更智能的全面更新解析

ollama v0.16.1发布：安装体验优化、模型加载超时可配置、图像生成更智能的全面更新解析主要技术亮点：1. 安装体验全面优化• macOS安装仅在需要时请求密码。• Windows安装新增实时进度条。2. 模型系统更智能• 新增minimax-m2.5作为首选推荐云模型。• 推荐模型标注“(not downloaded)”状态。• 云模型token限制范围更合理。3. 文档体验再升级• 快速入门文档更直观。• 工具与API示例更全面。• 支持更丰富的集成助手。4. 图像生成模块可配置• 通过OLLAMA_LOAD_TIMEOUT灵活控制加载时间。

0 点赞评论收藏

02-13 07:03

北京动视元科技有限公司_产品中心_研发工程师

golang 1.26.0 史上最强更新来了：GC大升级、SIMD加速、泛型增强、加密重构、日志系统

golang 1.26.0 史上最强更新来了：GC大升级、SIMD加速、泛型增强、加密重构、日志系统革新，全方位性能暴击！一、语言层面革新：new(expr) 改写 Go 语法二、泛型增强：支持递归类型约束三、错误处理新姿势：Type-safe errors.AsType四、Green Tea GC：全新垃圾回收算法五、性能全面提升1. Cgo 与系统调用优化移除 _Psyscall 状态，统一使用 goroutine 状态追踪，大幅减少锁竞争。性能提升：• cgo 调用降低约 30%• 系统调用提速近 10%2. 小对象内存分配提速新增按固定尺寸分配的跳转表机制，小对象内存分配提速 30%。GOEXPERIMENT=nosizespecializedmalloc 可禁用。六、SIMD 指令集支持（实验性）七、安全特性强化1. Secret 模式（runtimesecret 实验）2. 无 Reader 加密接口八、全新加密方案：HPKE 支持九、运行时与并发可观测性提升1. Goroutine 泄漏分析（实验性）2. 新 goroutine metrics十、反射增强：迭代式反射操作十一、标准库实用增强1. bytes.Buffer.Peek2. 进程句柄访问3. 信号上下文附带原因4. IP 子网比较5. Context-aware Dial6. httptest.Server Client 改进十二、性能与体验再进化十二、性能与体验再进化1. fmt.Errorf 优化2. io.ReadAll 改进十三、日志新特性：多 Handler 支持十四、测试体系增强：Test Artifact 支持十五、go fix 工具现代化

0 点赞评论收藏

02-12 07:41

北京动视元科技有限公司_产品中心_研发工程师

0 点赞评论收藏

02-11 06:54

北京动视元科技有限公司_产品中心_研发工程师

nginx 1.29.5 发布：修复重大安全漏洞 CVE-2026-1642，全面优化 SSL、Fa

nginx 1.29.5 发布：修复重大安全漏洞 CVE-2026-1642，全面优化 SSL、FastCGI、SCGI、uwsgi、Range 等模块！（1）总体版本标识更新• src/core/nginx.h 中版本号从 1.29.4 更新为 1.29.5。• 同时更新内部常量 nginx_version 1029005。（2）LICENSE 更新• 版权年份更新至 2026，标志着 nginx 核心代码版权继续延伸。• 文件中版权声明从 2025 年调整为 2026 年。（3）SSL 模块改进与日志优化在 src/event/ngx_event_openssl.c 文件中：• 增加对 SSL_R_TLSV1_ALERT_ECH_REQUIRED（1121） 的识别。• 调整 “ech_required” TLS 警告的日志等级，从 crit 降为 info，以减少不必要的高强度告警。这使得管理员在运行时更容易区分真正的严重错误与普通的 TLS 提示。（4）FastCGI、SCGI、uwsgi 三大后端协议改进在这三个模块（ngx_http_fastcgi_module.c、ngx_http_scgi_module.c、ngx_http_uwsgi_module.c）中，新增了一个统一的初始化逻辑：• 新增 HTTP_HOST 参数传递机制，确保在代理到后端时，HTTP_HOST 能保持与请求目标一致。

0 点赞评论收藏

02-10 06:40

北京动视元科技有限公司_产品中心_研发工程师

redis 8.4.1 正式发布：安全升级、性能强化与多模块重大修复详解 RediSearch 模

redis 8.4.1 正式发布：安全升级、性能强化与多模块重大修复详解RediSearch 模块的更新在本次版本中数量最多，涵盖从查询准确性、稳定性到 GC 与线程安全的方方面面：• 修正空字符串分词计数问题，确保文本偏移计算准确。• 防止 FT.INFO 命令不必要地向副本节点广播以减少集群流量。• 当接近内存限制时，在 FT.AGGREGATE 操作中增加后台索引 OOM 警告。• 修复 FT.AGGREGATEreducer 并发导致的间歇性错误问题。• 纠正 BM25STD 评分函数的下溢错误，防止得分异常。• 确保 totalDocsLen 更新准确，从而维持正确的文档统计。• 修正内存统计类型错误，防止溢出。• 优化 FT.CREATE 命令在非 Intel 架构下 LeanVec 参数的兼容性。• 校验 search-min-operation-workers 的最小值，避免配置错误。• 防止 FT.HYBRID 查询中协调器死锁，通过避免索引读锁实现。• 确保在超时时返回策略下 FT.PROFILE 能完整输出分析结果。• 移除调试聚合中过时的校验逻辑以兼容集群模式。• 确保集群模式下内部游标立即删除，防止残留内存和资源泄漏。• 修复垃圾回收（GC）回归问题，提升模块稳定性。• 防止分叉 GC 错误路径上的双重释放操作。• 实现 HGETALL 命令在 HDT 模式下的正确传播逻辑。• 异步减少工作线程数量以防止性能退化。• 修复带 WITHSCORES 参数的聚合查询在协调层的参数解析。• 正确处理 IO 线程在关闭时的连接释放和上下文清理。• 解决游标逻辑泄露可能导致的资源耗尽问题。• 在 FT.AGGREGATE 中添加 WITHCOUNT 支持。• 正确处理含有嵌入 NULL 的二进制数据，防止崩溃。• 修复 SVS GC 在无工作线程场景下的稳定性。• 修复集群模式下命令路由依赖分片索引问题。• 通过参数 FT.HYBRID 支持向量 blob。• 在聚合空回复时正确处理警告信息。• 删除 DownloadFile 断言语句以防止进程崩溃。• 支持多条警告在回复中返回以防止丢失。• 修复启用主动-主动模式下的内存泄漏问题。• 删除 spec 中非文本字段错误注册造成的字段处理异常。• 重构 keys 字典结构，防止字段管理错误。• 禁止命令注册使用负 key 位置，保证兼容性。

0 点赞评论收藏

02-09 08:53

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.15.6发布：上下文限制修复、自动模型下载、Claude环境变量优化、Droid

ollama v0.15.6发布：上下文限制修复、自动模型下载、Claude环境变量优化、Droid与Qwen全面更新详解1. 修复 ollama launch droid 的上下文限制 (context limits)2. ollama launch 命令在缺少模型时自动下载模型，而不再报错3. 解决 ollama launch claude 提供图像时造成上下文压缩 (context compaction) 的问题4. 新增 ANTHROPIC_* 环境变量支持 Claude Code 的模型调用逻辑5. 增强 cmd/config 相关测试，新增多项自动化覆盖测试6. 分离与独立 tokenizer 模块，将文本处理逻辑彻底从 model 包迁移7. 将 x/mlxrunner 模块重构为 x/imagegen8. 修正 Dockerfile 构建路径错误 — mlx 目录层级更新9. 修改 FAQ：增加关于 OLLAMA_NUM_PARALLEL 并行参数所需的内存说明

0 点赞评论收藏

02-08 06:55

北京动视元科技有限公司_产品中心_研发工程师

dify 1.12.1版本发布：修复基础URL与Docker数据持久化等关键问题，让开发更稳定！

dify 1.12.1版本发布：修复基础URL与Docker数据持久化等关键问题，让开发更稳定！🚀 版本亮点一：Docker数据持久化全面升级此次更新最重要的改进之一，便是针对 IRIS 数据在容器重建时的持久化问题 提出的优化方案。新版在Docker中引入了 Durable %SYS 持久化机制，确保IRIS数据在容器重启或重建后仍能被保留。具体更新包括：• 修复IRIS数据在容器重建时无法持久化的问题• 通过完善的Durable %SYS机制提升数据稳定性这一改动让使用Docker部署Dify的开发者不再担心数据丢失问题，大幅提升了系统的可靠性和可维护性。🌐 版本亮点二：Client基础URL修复在1.12.1版本中，开发团队还修复了 客户端基础URL不正确 的问题。该问题曾导致部分请求路径错误或资源加载失败，如今通过本次修复，客户端请求的基础路径得到正确配置，使前后端交互更稳定，部署更简便。⚙️ 版本亮点三：环境变量与循环逻辑的优化1. 自动摘要环境变量修复新版本修复了自动摘要功能的环境变量配置问题，使该功能在不同环境中能够正常使用，无需手动调整变量。2. 修复delete_draft_variables_batch无限循环问题过去，该批量删除草稿变量的操作在某些情况下会陷入无限循环。Dify 1.12.1对此进行了修正，确保该功能高效执行并避免系统卡死。🧩 版本亮点四：版本号同步更新在本次更新中，开发团队还进行了版本号同步的维护：• docker-compose与包管理器的版本统一更新至1.12.1这保证了所有部署方式与依赖的版本一致性，减少因版本差异引起的兼容性问题。

0 点赞评论收藏

02-07 07:05

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.15.5正式发布：全新Qwen3-Coder-Next与GLM-OCR模型登场，

ollama v0.15.5正式发布：全新Qwen3-Coder-Next与GLM-OCR模型登场，上下游功能全面进化ollama v0.15.5 是对开发者体验和模型性能的双重升级版本。核心亮点包括：• 双新模型接入：Qwen3-Coder-Next、GLM-OCR• Sub-agent 支持与参数化启动机制完善• 显存分级上下文长度智能设定• GLM-4.7-Flash 实验性引擎支持• 登录与错误提示体验优化• 跨平台支持与稳定性增强这一版本不仅提升了大规模模型在多任务环境下的执行效率，也进一步降低了开发者的使用门槛。无论是代码生成、文档识别还是多代理协作，ollama v0.15.5 都为智能化的本地开发提供了强劲的动力。

0 点赞评论收藏

02-06 06:32

北京动视元科技有限公司_产品中心_研发工程师

golang 1.25.7 发布：修复安全漏洞与编译器缺陷，提升加密与构建稳定性在 Go 官方

golang 1.25.7 发布：修复安全漏洞与编译器缺陷，提升加密与构建稳定性在 Go 官方 issue 追踪系统中，Go1.25.7 milestone 关联了多条已关闭的修复任务，均标记为 “CherryPickApproved”，代表这些改动已被审查并合入稳定版本。以下为具体修复内容：1. crypto/tls 修复项• 修复 macOS 上的会话恢复问题：此前 CL 737700 导致会话恢复失败，此版本已修复。• 还原 Config.Clone 修改：简化并优化证书链验证逻辑，提升 TLS 安全性和兼容性。2. crypto/x509 修复项• 修复单标签 DNS 排除约束问题：此前单标签排除约束会错误匹配所有通配符 SAN，此版本已修复，增强域名匹配准确性。3. cmd/go 安全修复• 防止文档注释代码投递漏洞（CVE-2025-61732）：修复潜在的代码伪装风险，有效提升源代码安全检查能力。4. cmd/compile 修复项• 解决 Linux/arm64 下编译时 OOM 问题：针对内存溢出问题进行了有效修正，提高编译稳定性。

0 点赞评论收藏

02-05 06:40

北京动视元科技有限公司_产品中心_研发工程师

ComfyUI v0.12.2 发布——新增 4B ACE Step 1.5 模型支持，修复多项稳定

ComfyUI v0.12.2 发布——新增 4B ACE Step 1.5 模型支持，修复多项稳定性问题！⚙️ 更新亮点一：新增 4B ACE Step 1.5 模型支持v0.12.2 中最重磅的更新是支持了 ACE Step 1.5 的 4B LM 模型。在此前版本中，ComfyUI 已支持 Qwen3_2B 系列相关模型。本次更新在 comfy/text_encoders/ace15.py 与 comfy/text_encoders/llama.py 文件中，正式扩展了对更大参数量模型 —— Qwen3_4B_ACE15_lm 的支持。新增内容包括：• 新增模型类：Qwen3_4B_ACE15_lm• 新增配置类：Qwen3_4B_ACE15_lm_Config• 更新 ACE15TEModel 逻辑，可根据参数 lm_model 自动加载 2B 或 4B 模型。• 在切换不同 LM 模型时，内部常数与显存估算逻辑自动调整。此外，comfy/sd.py 和 comfy/supported_models.py 亦同步适配，能够自动检测并加载 Qwen3_2B 或 Qwen3_4B 模型，从而实现双版本自动识别与切换支持。

0 点赞评论收藏

02-04 07:35

北京动视元科技有限公司_产品中心_研发工程师

openclaw v2026.2.1 发布：安全强化、系统提示升级、UI优化与性能全面提升

openclaw v2026.2.1 发布：安全强化、系统提示升级、UI优化与性能全面提升一、文档与平台优化• 完成 onboarding、install、i18n、exec-approvals、Control UI、exe.dev、cacheRetention 等文档更新，修正导航与拼写问题。• CI 增加正式一致性检查与别名一致性验证。• Onboarding 增加更友好的 Windows 新手提示信息。二、Agent 模块重大更新• 新增 OpenRouter 应用归属标头，支持系统识别应用来源。• 新增 系统提示安全防护机制（system prompt safety guardrails），强化上下文安全性。• 将 pi-ai 升级至 0.50.9 版本，并将 cacheControlTtl 更名为 cacheRetention（保留向后兼容）。• 在 CreateAgentSessionOptions 中扩展 systemPrompt、skills、contextFiles 等选项。• 增加工具策略一致性快照，无运行时行为变化，但增强整体稳定性。• 对嵌入式执行器与 pi-coding-agent API 进行了对齐更新（pi 0.51.0）。• 确保 OpenRouter 标头在嵌入式运行中也生效。• 限制上下文窗口解析大小，防止压缩过度。• 修复系统提示覆盖与当前日期时间提示机制问题（通过 session_status 进行提示）。• 修复 Pi 提示模板参数语法错误。• 新增 before_tool_call 插件钩子并整合到工具执行链路中。• 对子代理（Subagents）修复异常竞态问题，保证生命周期结束事件正确触发。

0 点赞评论收藏

02-03 06:41

北京动视元科技有限公司_产品中心_研发工程师

ollama v0.15.4 更新：OpenClaw全面上线，优化集成流程与工具解析能力大升级！

ollama v0.15.4 更新：OpenClaw全面上线，优化集成流程与工具解析能力大升级！本次核心更新在于 “ollama launch openclaw” 命令的全新行为。• 当首次运行 ollama launch openclaw 时，系统将自动进入标准的 OpenClaw Onboarding 流程。• 如果此前未完成配置，OpenClaw 会自动执行 onboard 启动向导，并使用本地访问令牌 ollama 进行网关初始化。• 这一流程通过检测配置文件中 wizard.lastRunAt 标记是否存在来判断是否已经完成向导：• 若 .openclaw/openclaw.json 或旧版 .clawdbot/clawdbot.json 文件中缺少标记，则会自动进入初始化。• 若配置完整，则直接运行 OpenClaw 网关服务。该逻辑在新增的 onboarded() 函数中实现，能够自动识别配置来源、处理旧路径兼容、解析损坏或错误类型的 JSON 并安全回退。测试文件 openclaw_test.go 也同步新增了多维度的单元测试，包含：• 无配置文件时返回 false• wizard 节缺失或为空时的判断• 正确识别 wizard.lastRunAt• 兼容旧 .clawdbot 路径• 优先使用新路径并忽略旧路径• 识别损坏的 JSON 结构这一系列完善的自动化判断与测试逻辑，确保 OpenClaw 在首次使用和迁移时均能平滑过渡。

0 点赞评论收藏

02-02 06:38

北京动视元科技有限公司_产品中心_研发工程师

DeepSpeed v0.18.5 发布：PyTorch 2.9 适配、ZeRO-3 优化与多项关键

DeepSpeed v0.18.5 发布：PyTorch 2.9 适配、ZeRO-3 优化与多项关键修复全面升级！🚀 功能与修复详情✅ 系统与测试优化• 更新版本号文件 version.txt（v0.18.4 → v0.18.5）。• 增强在 Apple MPS 平台上的运行兼容性。• 优化 GitHub Workflow 触发逻辑，新增测试超时限制。• 删除过时的 V100 测试触发器，提升 CI 效率。• 新增 完整测试套件工作流，确保功能覆盖更广。✅ 代码结构与稳定性增强• 删除 using namespace std. 语句，提升代码规范性。• 修复多进程测试问题。• 针对压缩 allreduce 操作添加空张量跳过逻辑。• 优化引擎清理机制（engine cleanup），减少冗余资源占用。• 修复 Ping-Pong 缓冲索引重置逻辑，移除多余的同步操作。

0 点赞评论收藏

02-01 07:09

北京动视元科技有限公司_产品中心_研发工程师

agno v2.4.7发布！新增Else条件分支、AWS Bedrock重排器、HITL等重大升级全

agno v2.4.7发布！新增Else条件分支、AWS Bedrock重排器、HITL等重大升级全解析1. Workflow Condition Step 全新支持 Else 分支工作流条件步骤（Workflow Condition Step）新增了 Else path 支持，允许用户定义备用执行路径（else_steps）。以前，当条件不满足时系统会跳过执行；现在，用户可以在条件为False时指定另一条执行路径，实现更灵活的业务流程控制。典型场景：• 技术支持系统的多分支路由：• 技术类问题 → 诊断 + 工程处理• 非技术性咨询 → 一般客服处理• 统一进入后续总结步骤示例代码中，Condition 对象新增了 else_steps 参数，可同步与异步执行。官方示例脚本：• condition_with_else_steps.py（同步与异步版本）展示了完整的if-else工作流结构及执行逻辑。2. AwsBedrockReranker 全新上线新增 AwsBedrockReranker 类，支持：• Cohere Rerank 3.5• Amazon Rerank 1.0该功能基于 Bedrock Agent Runtime API 的统一接口，让开发者可直接利用亚马逊云上的大模型能力实现高精度文档重排（Reranking）。支持的模型：• cohere.rerank-v3-5:0• amazon.rerank-v1:0主要优势：• 支持统一Bedrock API调用• 支持top_n自定义返回数量• 兼容Knowledge与PgVector向量数据库额外支持：• CohereBedrockReranker及AmazonReranker便捷类• 自定义additional_model_request_fields选项

0 点赞评论收藏

创作者周榜

关注他的用户也关注了：