智谱Ai infra一面面经
发一下问题给大家参考,攒攒人品!
1.实习拷打
2.简述一下minmax和percentile有什么不同?
3.你还知道什么其他校准算法吗?回答kl和mse,简单讲了一下中心思想
4.在上家公司做vla的量化的时候说用了smoothquant,awq。按照量化粒度说明一下smoothquant是做的什么粒度的?了解gptq吗?他们分别的作用流程
5.上家公司一般量化到什么格式,聊到fp8,nvfp4
6.nvfp4的原理是什么样的,怎么做缩放的,在哪个维度缩放?保存的格式等
7.per-tensor/channel/group,哪个粒度更细?
8.代码实现一下minmax和percentile
1.实习拷打
2.简述一下minmax和percentile有什么不同?
3.你还知道什么其他校准算法吗?回答kl和mse,简单讲了一下中心思想
4.在上家公司做vla的量化的时候说用了smoothquant,awq。按照量化粒度说明一下smoothquant是做的什么粒度的?了解gptq吗?他们分别的作用流程
5.上家公司一般量化到什么格式,聊到fp8,nvfp4
6.nvfp4的原理是什么样的,怎么做缩放的,在哪个维度缩放?保存的格式等
7.per-tensor/channel/group,哪个粒度更细?
8.代码实现一下minmax和percentile
全部评论
相关推荐
