昨天 10:53 门头沟学院人工智能发布于山东

关注

芯片架构速成教学：GPU篇

GPU 中文翻译是图形处理器，这个目的是快速处理电脑游戏中的图形和画面，说白了是拿来打游戏用的，或者工业级精度调试。

第二点，为什么GPU适合处理ai梯度计算？

因为采用并行计算，也就是大规模并行化，内部含有大量的core。

这个适合也是因为LLM计算的基本上都是矩阵的算法，重复类似的计算，然后呢，GPU有大量的核嘛，可以同时运行。

讲gpu我们还是讲英伟达的卡嘛，我们这篇只讲架构，因为我不是科技宅，我不在乎手机的配置有什么，我也不在乎这个显卡多贵多快，这个与我而言是无效的信息，同样的，我也不花太多时间在媒体平台上，因为我不关心其他人今天吃了什么，今天又去那里玩了，我真正关心的是时政，或者这个国家20年之后的模样。

好了，接着讲。这个一般是SM：流式多处理器架构。

SM：一个 GPU 芯片通常包含几十到上百个 SM。

它的作用：每个 SM 都是一个独立的计算单元，可以同时处理不同的任务流。

CUDA Cores：SM 内部的最小计算单元，就是“核心”数量。作用也就是：专门执行简单的数学运算

Tensor Cores（张量核心）：现代 GPU 专为 AI 和深度学习添加的特殊计算核心（从 NVIDIA Volta 架构开始）。

这个东西就是专门优化用于矩阵乘法（即“张量运算”，是深度学习中最核心的运算）。

有了这个就可以一次性处理更大的数据块，大幅度提升 AI 训练和推理（例如 LLM 的推理）的速度。这就是为什么高性能计算领域的 AI 工程师都非常看重 Tensor Cores 的数量和性能。

显存：附着在 GPU 芯片旁边的高速内存。用来存储 AI 模型的参数、权重、计算中间结果（例如 KV Cache）。

重要性：显存的容量和带宽直接决定了您能运行多大的 AI 模型，以及数据传输的速度。您的 LLM 优化问题（如 PageAttention）就是在解决如何更高效地管理和使用这个“仓库”。

那么其实给我下一篇讲怎么优化给了条件了，所有的优化都是在芯片架构上来的。

#聊聊我眼中的AI#

机器学习，推理优化，芯片架构。文章被收录于专栏

放一些相关的，这里算是大模型的进阶版了。这个封面是吉米。

全部评论

推荐最新楼层

12-07 00:02

贵州中医药大学算法工程师

求各位大佬指点 为什么呀？没有释放

点赞评论收藏

12-09 17:41

虾皮信息_客户端开发工程师(准入职员工)

叠纸游戏内推，叠纸游戏内推码

前端面试问题：1. 自我介绍2. 低代码平台Blocksuit方案，这个技术选型的逻辑3. 物料和数据源连接是用什么样的解决方案，还追了一下数据源的获取4. 团队规模，负责的具体内容，职责之类的5. 你认为前端工程化包括哪些方面？你具体做过哪些6. Git提交，你们有引入什么工具，检测方式来控制不规范提交7. 前端监控埋点方面有做过哪些吗8. 后面的职业规划9. 离职原因10. 排期和人手不够的情况，假设你作为leader，你怎么处理冲突？反问：1. 项目情况，技术栈2. 面试流程叠纸游戏26届秋校+27届nova训练营热力全开！🎮我们是：叠纸游戏成立于2013年8月，是一家专注于内容创作的...

点赞评论收藏

12-09 11:28

东莞理工学院 Java

开发中间件公司，看重技术深度的挖掘

📍 🕐面试时间：2025/12/9💻面试岗位：java开发实习生❓面试问题：Seata框架是怎么实现全局事务性怎么通过维护全局事务XID,TC分发branchId的方式实现的全局事务性它和mysql的两阶段提交有什么区别和相似点如果让你设计一个EventBus，你会怎么设计🙌面试感想：公司官网：https://www.cdmgr.com/cloudm做技术中间件面的公司，纯粹的项目技术深度挖掘，更看重底层如何实现；上班忙也得挖掘技术深度啊

查看4道真题和解析

点赞评论收藏

11-22 20:05

西南石油大学数据分析师

浩鲸科技面经

一面Java基础是否了解多态，举例说明在项目中如何运用多态？Spring中反射有哪些应用？你在项目中如何使用反射？ArrayList和LinkedList的区别？应用场景？项目中有无使用LinkedList的具体例子？介绍一下线程池的核心参数，使用中遇到过什么问题？是否有效率提升？说一下对JVM的理解以及垃圾回收算法，有没有类似虚拟机调优的经验MySQL：默认事务隔离级别？有没有SQL调优的一些经验有无遇到过特殊的“索引失效”的情况？就是好像用了索引但实际上却没有用到？怎么解决的？解释“最左前缀原则”。中间件（主要根据你的自我介绍来问）是否用过Elasticsearch，有没有了解过它的倒排索...

查看18道真题和解析

点赞评论收藏

12-05 20:56

郑州西亚斯学院 Java

28学院本告别互联网…

难道只能去考研了吗…下面说一下我的情况，我算是消息比较灵通的，大一就库库跟黑马学习，着急着把技术栈都过一遍，大一那会儿的想法是大三给自己一份成绩（进大厂技术岗）拿不出来就去考研…一年后呢，2000+（大概面了十几家吧）找了份北京小公司（快离职了），没啥太大的成长。现在也是见识到了自己确实无力回天研发岗，也是向曾经那个热情的自己回应了妥协的想法，转测开，其实现在在快速学习python 想碰瓷碰瓷深度学习机器学习…，对于我的大厂梦我做出了下面的一份测开简历（图2），打算是熟悉一下，包装，准备来年…  各位朋友怎么看不太想考研因为自己上了民办四年要花不少钱，读研的话又花，条件是不行的，于是就萌生了早早毕业挣钱。要是读读不上92，互联网环境愈发下行，我真告别互联网了…

只因你泰卷辣：接受小公司的java人生，还是过得不错的，进不了大厂，那就好好过早九晚七双休的工作，放宽心态

点赞评论收藏

招聘动态

广发证券

全站热榜

华为进展交流圈

热聊中

创作者周榜

正在热议