2021-01-21 15:41 北京邮电大学算法工程师

关注

【模型优化】量化

量化简介

图片说明
你看原始信号就是模拟信号，如声音，但是我们要把真实世界的信号带到数字处理领域来，于是就得采样！所谓采样就是把握信号的主要部分，丢掉高频细节部分，真实世界可是一个超高精度的程序空间呀，因此我们要放到我们的计算机中来的话，就得降低精度存储进来了！对应的硬件电路如上图所示，就是高维现实空间跟低维程序空间的一个最底层最硬核的接口了！这些我们在大一就都学过的应该好理解的吧！总之，简单来说量化就是在原信号上的采样而已了！

就是把你一个layer的激活值范围的给圈出来，然后按照绝对值最大值作为阀值（因此当正负分布不均匀的时候，是有一部分是空缺的，也就是一部分- 值域被浪费了；这里有个小坑就是，假如我的激活址全是正的，没有负值，那么你怎么映射呢？），然后把这个范围直接按比例给映射到正负128的范围内来。
上面是简单的max-max 映射，这是针对均匀分布的，很明显的可以知道，只要数据分布的不是很均匀，那么精度损失是很大很明显的

举个极限的例子就是量化后原本int8的动态范围只剩1bit了（就是正的样本没有，负的全部扎堆在一个很小的值附近），就是上面说到的满屏马赛克～这种情况下。。。那还表示个毛的原信息啊！

于是很多情况下是这么干的：
图片说明
像上图这样，先找一个阀值T，然后低于最低阀值的就全部都饱和映射到-127上，如上图的左边的三个红色的点就是这么处理的。

怎么寻找T

NVIDIA选择的是KL-divergence，其实就是相对熵，那为什么要选择相对熵呢？而不是其他的别的什么呢？因为相对熵表述的就是两个分布的差异程度，放到我们的情境里面来就是量化前后两个分布的差异程度，差异最小就是最好的了~因此问题转换为求相对熵的最小值！

对于模型的每一层来说：

第一步就是得到该layer激活值的直方分布图。
在不同的截断阀值下产生许多的量化分布。
然后选择KL距离最小的阀值。

获取分布

我们只能采用有限的采样率，这里TensorRT取的2048bins，而maxnet则取的是4000bins（仅正半轴），bins越多，优点是找到的饱和阀值更好，但是缺陷是在迭代搜索饱和阀址时计算更慢

获取截断阈值

英伟达只考虑正半轴的分布，因为用relu函数激活，输出肯定大于0，

全部评论

推荐最新楼层

05-18 09:21

北京邮电大学嵌入式工程师

嵌入式进大厂需要怎么学之入门

这篇文章主要写给大学刚接触嵌入式的同学。很多新手觉得嵌入式入门并不容易，要牵扯的知识点太多——C 语言基础掌握了吗？汇编了解吗？电路原理学得怎么样，能看懂简单的原理图吗？AD 软件会画板子吗？下面我会从这几个方面聊聊：嵌入式的前景如何入门嵌入式怎么才算掌握一个单片机学习单片机的最快途径一、嵌入式的前景有一种说法是：下一个时代是物联网的时代。未来的生活一定是智能的、万物互联的——所有家电都会汇聚到一个终端上，通过它就可以控制周围的一切。就像扎克伯格给自己家写的那套系统一样，一个语音助手就能管整个家。而这些智能设备，都需要嵌入式开发者去做：把程序烧进设备里，让它们任你控制。干这行最爽的一点是：你能...

点赞评论收藏

分享

05-20 20:39

已编辑

南京邮电大学 Java

两个月，用Go语言重写龙虾🦞，GitHub斩获4700stars

我们是开源社区OpenAgent 团队的开发者。花了两个月，用Go语言做了一个真正的0配置，0依赖，双击就能使用的个人本地单文件版龙虾🦞。真正做到了开箱即用，也受到了很多社区中的关注。OpenAgent，一个面向个人开发者和极客的开源本地 AI Agent。定位跟 OpenClaw、Hermes 类似，都是个人本地助手这个赛道，但我们走了一条完全不同的路：用 Go 语言写成一个单文件二进制，下载 exe 双击就能跑，零配置开箱即用。项目地址：https://github.com/the-open-agent/openagent假如这个项目的功能或者架构帮助到你了，希望可以给我们的项目一个st...

mcart：支持一波，思路上给我了参考

简历中的项目经历要怎么写

点赞评论收藏

分享

04-20 19:47

东华理工大学 Web前端

还以为真有人这么好心会捞.....

真没招了  原来是卖课的.. 把我的感动还来...

天降大厂offer：所以个人信息是泄露了

点赞评论收藏

分享

05-17 13:19

北京理工大学 Java

美团后端暑期一面

滴滴这周刚入职，感觉还没太适应，美团这边又打来了电话，居然周六也能面，顺便面了一下，部门是核心本地商业下面的基础研发平台，总时长30分钟左右，无手撕。顺带一提，美团这个岗和我现在滴滴的岗干的活几乎一样，都是数据平台相关...你的Java是自学还是说专业课学的？这两个项目是你自己练手的，还是参与什么比赛或活动搞的？我看你这两个项目时间都挺长的，大概至少两个月左右，是做了一个比较长时间的学习是吧？那你挑一个介绍一下，具体做了哪些工作？找一个你觉得最有难度或最有代表性的。你们也是学了现在典型AI的用法，然后加了一些新花样进去。那你一开始做这个项目的时候，加了这些东西之后有测试过吗？或者说你做完这个工...

查看26道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何成为1个AI工程师？ #

7484次浏览 332人参与

# 我想去国央企的原因 #

80685次浏览 420人参与

# 26届春招投递记录 #

42497次浏览 354人参与

# 小米编程考试 #

41966次浏览 159人参与

# 27届实习投递记录 #

131080次浏览 1453人参与

# 面试被问期望薪资时该如何回答 #

407379次浏览 2224人参与

# 我在大厂见过的最低学历 #

8170次浏览 78人参与

# 你觉得第一学历对求职有影响吗？ #

277646次浏览 1501人参与

# 联想求职进展汇总 #

365415次浏览 2270人参与

# 机械人你觉得今年行情怎么样？ #

10093次浏览 100人参与

# 秋招拿一个offer可以躺平吗 #

278485次浏览 1416人参与

# 大疆工作体验 #

34673次浏览 95人参与

# 虹软科技求职进展汇总 #

18748次浏览 141人参与

# 你觉得机械有必要实习吗 #

89569次浏览 538人参与

# 要毕业了，再不说就来不及了 #

12325次浏览 175人参与

# 你在职场上见过哪些“水货”同事 #

42345次浏览 181人参与

# AI面会问哪些问题？ #

138779次浏览 3798人参与

# 机械人求职现状 #

44323次浏览 329人参与

# 你今年的平均薪资是多少？ #

231084次浏览 1071人参与

# 工作丧失热情的瞬间 #

401959次浏览 2590人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务