avatar-decorate
获赞
5199
粉丝
216
关注
231
看过 TA
714
西昌学院
2011
golang
IP属地:北京
微信公众号:福大大架构师每日一题
私信
关注
ollama v0.22.0 发布:新增 NVIDIA Nemotron 3 Omni 与 Poolside Laguna 模型支持,推理能力再升级!新模型支持:两大重量级模型登场1.1 NVIDIA Nemotron 3 Omniv0.22.0 引入了对 NVIDIA Nemotron 3 Omni 系列模型的原生支持。这是一个多模态模型家族,在代码中对应的架构标识为 nemotron_h_omni。该模型支持:• 文本生成:基于 Nemotron-H 架构的 LLM 核心• 视觉理解:集成了 Vision Transformer(ViT)模块,支持图像输入• 音频处理:集成了 Parakeet 音频编码器,支持语音输入在转换器(converter)层面,新增了 convert/convert_nemotron_h.go 和 convert/convert_nemotron_h_test.go 两个文件(共约 700 行代码),专门处理 Nemotron 系列模型的权重映射和参数转换。关键配置参数包括:• max_sequence_length: 131072(128K 上下文)• vision.image_size: 512• vision.patch_size: 16• audio.sample_rate: 160001.2 Poolside Laguna XS.2Poolside 的首个开源权重编码模型 Laguna XS.2 也获得了完整支持。这是一个专注于代码生成和软件工程任务的模型,架构标识为 LagunaForCausalLM。新增的模型支持文件包括:• model/models/laguna/model.go(约 440 行):Laguna 模型的 MLX 实现• convert/convert_laguna.go(约 600 行):GGUF 转换逻辑• model/parsers/laguna.go(约 500 行):专用的输出解析器• model/renderers/laguna.go(约 110 行):模板渲染器
0 点赞 评论 收藏
分享
openclaw v2026.4.24 发布:Google Meet 深度集成、DeepSeek V4 上线、浏览器自动化与插件架构全面升级核心亮点(Highlights)1. Google Meet 正式成为 OpenClaw 原生参与者插件Google Meet 以捆绑参与者插件的形式加入 OpenClaw。该插件支持:• 个人 Google 账号认证(OAuth)• Chrome / Twilio 实时会话• 配对节点 Chrome 支持(用于 Parallels 风格的 Chrome/BlackHole/SoX 主机)• 会议记录、录音、转录、智能笔记、参与者会话等工件与出勤导出• 针对已打开的 Meet 标签页的恢复工具(googlemeet recover-tab)2. DeepSeek V4 系列模型入包,V4 Flash 成为默认模型• DeepSeek V4 Flash 和 DeepSeek V4 Pro 已加入捆绑模型目录。• V4 Flash 成为新用户 onboarding 的默认模型。• 修复了 DeepSeek 思维链(thinking)在后续工具调用轮次中的回放行为。3. 实时语音循环增强:Talk、Voice Call、Google Meet 可调用完整 OpenClaw 代理Talk 模式、语音电话和 Google Meet 现在可以使用实时语音循环,并能咨询完整的 OpenClaw 代理以获取更深入的、基于工具的答案。4. 浏览器自动化升级• 坐标点击(viewport coordinate clicks)• 更长的默认操作预算(60 秒)• 支持按配置文件单独设置 headless 模式• 更稳定的标签页复用与恢复5. 插件与模型基础设施启动更轻量• 静态模型目录• 基于 manifest 的模型行• 延迟加载 provider 依赖• 针对打包安装的外部运行时依赖修复openclaw v2026.4.24 发布:Google Meet 深度集成、DeepSeek V4 上线、浏览器自动化与插件架构全面升级核心亮点(Highlights)1. Google Meet 正式成为 OpenClaw 原生参与者插件Google Meet 以捆绑参与者插件的形式加入 OpenClaw。该插件支持:• 个人 Google 账号认证(OAuth)• Chrome / Twilio 实时会话• 配对节点 Chrome 支持(用于 Parallels 风格的 Chrome/BlackHole/SoX 主机)• 会议记录、录音、转录、智能笔记、参与者会话等工件与出勤导出• 针对已打开的 Meet 标签页的恢复工具(googlemeet recover-tab)2. DeepSeek V4 系列模型入包,V4 Flash 成为默认模型• DeepSeek V4 Flash 和 DeepSeek V4 Pro 已加入捆绑模型目录。• V4 Flash 成为新用户 onboarding 的默认模型。• 修复了 DeepSeek 思维链(thinking)在后续工具调用轮次中的回放行为。3. 实时语音循环增强:Talk、Voice Call、Google Meet 可调用完整 OpenClaw 代理Talk 模式、语音电话和 Google Meet 现在可以使用实时语音循环,并能咨询完整的 OpenClaw 代理以获取更深入的、基于工具的答案。4. 浏览器自动化升级• 坐标点击(viewport coordinate clicks)• 更长的默认操作预算(60 秒)• 支持按配置文件单独设置 headless 模式• 更稳定的标签页复用与恢复5. 插件与模型基础设施启动更轻量• 静态模型目录• 基于 manifest 的模型行• 延迟加载 provider 依赖• 针对打包安装的外部运行时依赖修复
0 点赞 评论 收藏
分享
DeepSeek-V4更新:百万 token 上下文、1.6T MoE、FP4+FP8 混合精度、Pro-Max 与 Flash-Max 全面解析DeepSeek-V4系列是DeepSeek-AI推出的新一代MoE架构语言模型,核心定位是“高效能、长上下文、多场景适配”,预览版本包含四款核心模型,分别为DeepSeek-V4-Flash、DeepSeek-V4-Flash-Base、DeepSeek-V4-Pro、DeepSeek-V4-Pro-Base,其中DeepSeek-V4-Flash与DeepSeek-V4-Pro为核心功能版本,Base版本则提供基础模型支持,满足不同开发者的轻量化或定制化需求。两款核心功能模型(DeepSeek-V4-Flash与DeepSeek-V4-Pro)均采用混合专家(MoE)架构,支持百万token(1M)的上下文长度,这意味着模型能够处理超长文本输入,适配长文档分析、多轮对话、代码审计等复杂场景。二者的核心差异集中在参数量与性能定位上:DeepSeek-V4-Pro总参数量达1.6T,激活参数量49B,主打高性能、全场景覆盖;DeepSeek-V4-Flash总参数量284B,激活参数量13B,主打轻量化、高效推理,在控制资源占用的同时兼顾性能表现。值得注意的是,DeepSeek-V4-Pro与DeepSeek-V4-Flash均支持三种推理强度模式,可根据实际任务需求灵活切换,同时推出Max推理模式(DeepSeek-V4-Pro-Max、DeepSeek-V4-Flash-Max),进一步挖掘模型推理潜力,其中DeepSeek-V4-Pro-Max稳居当前最佳开源模型之列,大幅缩小了与领先闭源模型的差距。
0 点赞 评论 收藏
分享
ollama v0.21.1发布:Kimi CLI原生集成、MLX推理性能飞跃、多模态长程任务能力全面进化Ollama v0.21.1 版本的更新覆盖范围广泛,涉及命令行工具、模型管理、推理引擎、API 接口、文档等多个模块,具体可分为以下几大板块:• 新增 Kimi Code CLI 集成,支持自动安装、配置与运行,实现 Moonshot coding agent 与 Ollama 模型的无缝联动;• MLX Runner 全面优化,包括采样器重构、张量管理线程安全优化、推理管道优化、logprobs 支持完善等;• 模型推荐与管理优化,更新推荐模型列表,调整模型排序规则,完善云模型上下文长度限制;• Hermes Agent 文档重构,优化快速启动流程,调整推荐模型说明,简化配置步骤;• API 接口修复,解决 gemma4 模型在禁用 thinking 时格式约束失效的问题,完善 logprobs 相关接口;• 模型相关优化,包括 gemma4、glm4_moe_lite 等模型的细节修复与功能完善。本次更新不涉及新增功能模块,全部围绕现有功能的优化与完善展开,重点解决了此前版本中存在的性能瓶颈、功能缺陷与体验痛点,尤其针对 MLX 推理引擎的优化,让搭载 Apple Silicon 芯片的设备运行本地模型时获得更出色的性能表现。
0 点赞 评论 收藏
分享
nginx 1.30.0稳定版深度解析:Early Hints、HTTP/2后端、MPTCP全量上线,1.29.x分支精华全面整合核心新特性全解析:1.29.x分支精华功能全面落地(一)HTTP协议增强:Early Hints正式支持,前端加载性能革命性提升nginx 1.30.0稳定版正式实现HTTP Early Hints(103 Early Hints)功能,该特性作为HTTP/1.1与HTTP/2协议的重要扩展,允许服务器在处理主请求(如200 OK响应)前,提前向客户端推送关键资源的预加载提示(如CSS、JS、字体、图片等静态资源),彻底解决传统“请求-响应”串行模式下的资源加载阻塞问题,大幅缩短页面首屏渲染时间(TTFP)与用户可交互时间(TTI)。Early Hints核心价值:1. 并行加载优化:客户端收到103状态码后,无需等待主响应完成,即可立即发起关键资源请求,与服务器主请求处理并行执行,将资源加载从“串行”转为“并行”,复杂页面加载速度提升30%-80%;2. 全协议兼容:同时支持HTTP/1.1、HTTP/2与HTTP/3协议,覆盖所有现代浏览器与客户端,无需改造业务代码即可启用;3. 与gRPC、上游代理深度兼容:修复gRPC代理与Early Hints组合场景下的请求重新初始化问题,确保微服务架构下Early Hints稳定生效;4. HTTP/3编码优化:针对HTTP/3协议实现“103 Early Hints”索引字段行编码,降低协议传输开销,提升QUIC场景下Early Hints传输效率;5. 多响应处理修复:解决上游服务器返回多个103 Early Hints响应时的处理异常,确保复杂上游集群场景下提示信息准确传递。
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务