今天 11:08 门头沟学院人工智能发布于山东

关注

框架优化速成教学：一，这个是现如今最先进的技术？

因为老是有hr偷看我简历，然后老是搞推理框架和算子优化的，我决定从头学一遍并且总结出来。

不搞芯片的不用学，这个吃学历和顶会的。也就是为什么我从一开始没搞这个，但是又收到了中科院和香港实验室之类的邀请。

现在学好像有点晚了。。。。算啦，搞一下吧。然后其实你们看到的稿子都是我写剩下的，一般都是写好几篇到点就发的。

本文需要先看了上期讲芯片的看了才容易点。

那么正式开始吧，本文的话还是按照vllm举例，因为时间有限，我和你们的时间都有限，所以我只讲最简单，最通用的东西，

第一点：基本上所有的推理优化都是优化Tensor Cores,

第二点：其他的SM架构，cuda cores无法被优化，这个是硬件，vllm这种算软件框架可以优化计算速度，

公式：最终加速速度 =Tensor Cores 提供的理论计算能力 * vLLM 等软件的效率提升因子

第三点：优化方向有很多，我这里列举一些，这个等于是扫盲教程，因为门槛过于高，而且极度歧视背景出身。

我写这个教程是因为感兴趣，当然能对这个感兴趣的人少，所以说看看得了，后续可能会讲怎么优化这些方向。

一、内存与调度	动态批处理 (Continuous Batching)	解决 GPU 空闲等待，保持计算的连续性。
	PageAttention 显存管理	解决 KV Cache 碎片问题，提高显存的利用率。
	Prefix Caching 优化	解决重复计算问题，减少内存带宽的重复消耗。
二、计算效率 (GPU Kernel)	编译器优化 (Triton/CUDA Kernel)	针对特定模型和硬件，编写最高效率的 GPU 代码，确保 Tensor Cores 100% 满负荷运行。
	推测解码 (Speculative Decoding)	通过算法创新，用更少的计算步骤（Token）达成相同的结果，减少 Tensor Cores 的总工作量。
三、数据传输	I/O 优化（PCIe, Zero-copy）	优化 CPU 内存与 GPU 显存之间，以及硬盘与内存之间的数据传输速度，避免 Tensor Cores 等待数据。
四、多卡协作	张量并行优化（NCCL/通信库）	优化多 GPU 之间的通信算法，确保计算任务分解和结果合并时的延迟最低。

#硬件/芯片公司工作体验#

全部评论

推荐最新楼层

昨天 14:51

门头沟学院 Java

携程真的抠啊！

985硕，后端岗位，给了23*15，太侮辱人了，秒拒

校招薪资来揭秘

点赞评论收藏

分享

12-03 10:49

迅雷_后端开发工程师(准入职员工)

阿里云内推，阿里云内推码

入职一个多月了，来分享一些landing的感受～ 整体说下：可以打85分，毕竟当时辞职就是想要走出舒适圈，的确也会有些不舒适，但基本上是因为阿里和网易风格有差别，需要一些时间适应 我所在的产品线整体风格不卷，加班不严重，周末大家都安排自己的生活，可以安心放下手机，也让我彻底放下“不秒回羞耻症” 阿里云团队规模太大，分工很细，人也很多，想搞清楚一件事情要对接好多好多人，要熟悉的流程也贼多，这个过程的确有些累，但我估计只要在大厂都会这样 感觉这边做事情自由度更高，换句话说，老板只要结果，过程怎么做自己想办法去 凡事凡人都爱讲价值。初次对接的其他部门的同事，也会直接问我，“你对业务的价值是什么” 前...

阿里云工作强度 708人发布

点赞评论收藏

分享

11-25 14:24

门头沟学院产品经理

百度泡出来了

等了好久终于等到，产经20k*16，没有签字费没让a，应该是白菜了吧

校招薪资来揭秘

点赞评论收藏

分享

昨天 17:41

合合信息_Agent数据工程师(准入职员工)

海康威视内推，海康威视内推码

岗位：武汉 嵌入式开发timeline：8.30 测评，10.9 一面，10.11 二面一面技术：自我介绍讲下实习经历平常怎么debug项目中有没有遇到什么问题，怎么解决的介绍一下学校经历了解数据结构吗？基本的数据结构？查找搜索效率？有什么方法可以提高效率？具体围绕数据结构问了很多RTOS，多任务操作反问：做存储固件的，具体的进来再分二面HR：北京线下，地点在北京研发中心，具体内容就是唠家常，一些HR面的基本问题销售工程师工作体验，总结累但成长很多。1.大家最先关注的就是HIK的工作压力，只能说体面厂没有辜负盛名！名不虚传！我来这边是销售岗，基本上每天都要差不多11点下班。因为销售不仅需要对接...

点赞评论收藏

分享

不愿透露姓名的神秘牛友

12-09 19:38

  数字马力知无不言

数字马力后端 10*12 本科其他

点赞评论收藏

分享

评论

1

收藏

招聘动态

广发证券

全站热榜

更多

数字马力交流圈

热聊中

华为进展交流圈

热聊中

创作者周榜

更多

正在热议

更多

# 找工作能把i人逼成什么样 #

7726次浏览 91人参与

# 大学最后一个寒假，我想…… #

69968次浏览 711人参与

# 百融云创求职进展汇总 #

23544次浏览 180人参与

# 0经验如何找实习？ #

18631次浏览 341人参与

# 大家每天通勤多久？ #

62887次浏览 407人参与

# 你今年做了几份实习？ #

5996次浏览 90人参与

# 度小满求职进展汇总 #

17400次浏览 87人参与

# 面试尴尬现场 #

201414次浏览 782人参与

# 字节出了豆包coding模型 #

5589次浏览 57人参与

# 大厂面试初体验 #

82349次浏览 373人参与

# 双非本科的出路是什么？ #

184361次浏览 1480人参与

# 你还有多少年退休？ #

29863次浏览 195人参与

# 你开始找寒假实习了吗？ #

10838次浏览 164人参与

# 你找工作经历过哪些骗局？ #

6816次浏览 116人参与

# 打工人的工作餐日常 #

76119次浏览 520人参与

2421次浏览 16人参与

# 实习越久越好，还是多多益善？ #

13990次浏览 142人参与

# 工作两年想退休了 #

201725次浏览 1783人参与

# 25年找工作是什么难度？ #

10913次浏览 108人参与

# 一起聊华为 #

165680次浏览 809人参与

# 简历无回复，你会继续海投还是优化再投？ #

128951次浏览 854人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务