首页 > 试题广场 >

把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同

[问答题]
把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。
BN Batch Normalization,是为了缓解模型的内部协变量偏移问题,即上层网络给下层网络的输入一直在变化,导致下层网络难以学习的问题。训练时使用当前batch的均值方差做标准化,再进行缩放和平移;推理时用全部样本累计的滑动平均进行
发表于 2025-09-21 17:15:17 回复(0)
BN(Batch Normalization)对批次内的所有样本进行均值为0,标准差为1的标准化,缓解下层网络难以学习的问题。训练时是以当前批次为参考,推理是整个样本。BN一般用在图像分类中,LN是在NLP中。GN在检测中
发表于 2025-10-24 00:04:50 回复(0)
1.bn是batchnormalization,对某一个批次内所有样本进行均值为0,标准差为1的标准化,在训练时参考的是当前批次的样本,但是在推理时期,参考的是训练集所有样本的均值和标准差,ln一般用在nlp中,可以处理不同长度的向量
发表于 2025-09-19 16:15:25 回复(0)
BN的原理是由于数据的分布成正态分布,bn先用均值为0,方差为1的正态分布函数将一批次的数据控制到0-1之间,避免的数据的连续性被破坏,BN是在图像处理中使用,LN一般是在自然语言处理中使用
发表于 2025-09-11 17:07:42 回复(0)