lmdeploy v0.11.1 版本发布：全面支持DeepSeek V3.2与

2025-12-28 06:48 北京动视元科技有限公司_产品中心_研发工程师

发布于北京

关注

lmdeploy v0.11.1 版本发布：全面支持DeepSeek V3.2与DPTP，多项性能优化与Bug修复

1. 监控与指标体系
对 metrics 进行了改进，使性能监控和运行状态统计更加完善，有助于生产环境中的观测与调优。
2. 调度与引擎优化
重构了调度器与 engine.py，优化了内部结构，提高了整体执行效率和可维护性。同时对 dp 超时时间进行了更新，使分布式场景下的任务调度更加稳定。
3. 模型与多模态支持增强
针对 Qwen3-VL 模型进行了多项改进，包括新增 vision id、增加多模态处理器参数，以及整体能力优化，显著提升了多模态推理的一致性与可扩展性。
4. 推理与请求处理能力
在请求被取消时，系统现在能够返回已路由的专家信息，提升了推理过程中的可解释性。
同时，v1/chat/completions 接口新增对 chat_template_kwargs 的支持，使对话模板配置更加灵活。
5. 内部结构与内存处理
为 dummy 输入预留 block，优化了内存使用策略；在预填充阶段构建 block trie 并增加命中率统计，提升了缓存与推理效率。
#大模型# #福大大架构师每日一题#

全部评论

推荐最新楼层

03-28 23:49

门头沟学院 C++

字节跳动-后端开发实习生-C++ 一面

1. 自我介绍2. 项目介绍3. 进程和线程的本质区别是什么，为什么线程切换通常更轻答案：进程是资源分配的基本单位，线程是 CPU 调度的基本单位。一个进程有自己独立的虚拟地址空间、文件描述符表、页表等资源；同一进程里的多个线程共享代码段、数据段、堆、打开的文件等资源，但每个线程有自己独立的栈、寄存器上下文和线程局部存储。线程切换通常比进程切换轻，是因为同进程线程切换时，不需要像进程切换那样频繁切换地址空间和页表，缓存和 TLB 的破坏通常也更小。但“轻”不代表没成本，线程切换依然涉及内核调度、寄存器保存恢复、可能的锁竞争和缓存失效。4. 进程通信方式有哪些，怎么选答案：常见的进程通信方式有管...

C++ 常考面试题总结

点赞评论收藏

03-31 12:20

厦门大学 ETL工程师

Vibe Coding开发前的 7 个关键步骤

这两天我Vibe Coding了一个项目，纯vibe那种,，一行代码都没有写。理解了很多Vibe Coding新手遇到的问题：AI写代码,改来改去越改越乱,最后项目直接崩了。 反思了一下自己Vibe Coding的过程之后，我清空了AI写了两个小时的代码，从头再来，这次就十分顺利地将项目开发完成。其实问题不在AI，而在于跳过了最重要的准备环节。就像盖房子，没有图纸就开工，盖到一半发现门窗位置不对，只能推倒重来。 所以，在让AI写第一行代码之前我们要做好些必要的准备工作。 打开 Claude或者 ChatGPT，跟它聊聊产品想法。按照这7个步骤，一步步来。 第一步：把想法聊清楚 把你的想法完整地...

勇敢的卷王在等off...：和同事聊了发现这7步里前3步就是产品经理的日常工作，所以PM做vibe coding有天然优势。但注意第2步——写给研发看的PRD和写给AI看的PRD完全是两个东西。给研发写'用户可以筛选订单' 研发秒懂给AI写同样的话它会给你生成一个你完全不认识的筛选器。所以建议在PRD里每个功能都附一句'验收标准是什么'