最近DeepSeek很火,老婆问我:“大模型的参数到底是什么东西?”我:所谓参数,参数,参天之数。其实参数本身就是一个数值,可能其中一个是3.123456789,另一个是-0.0009527。以DeepSpeek-R1最大版本为例,它有671B个参数(B代表十亿)。你可以把这些参数想象成一张巨大的网格,每个网格中都存储着一个数值。一个大模型通常包含几千亿个参数,这些参数占据了模型体积的90%以上。她听完更懵了:“一堆数字,凭什么能回答各种问题?”但凡你学习过初中数学,不是九年义务教育的漏网之鱼,你就应该知道:现在我们来拟合一条直线,假如你知道 a 和 b,那你就是这条直线的神,只要输入 x,你...