训练和推断时都使用当前 mini-batch 的均值和方差进行归一化。
训练时使用当前 mini-batch 的均值和方差,推断时使用在训练阶段学习到的全局移动平均均值和方差。
训练时使用全局的移动平均均值和方差,推断时使用当前 mini-batch 的均值和方差。
训练和推断时都使用固定的、预先计算好的全局均值和方差。
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题