首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同
[问答题]
把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。
查看答案及解析
添加笔记
求解答(0)
邀请回答
收藏(11)
分享
纠错
4个回答
添加回答
1
在考古的三文鱼很糊涂
BN Batch Normalization,是为了缓解模型的内部协变量偏移问题,即上层网络给下层网络的输入一直在变化,导致下层网络难以学习的问题。训练时使用当前batch的均值方差做标准化,再进行缩放和平移;推理时用全部样本累计的滑动平均进行
发表于 2025-09-21 17:15:17
回复(0)
0
懵懵的萌新
BN(Batch Normalization)对批次内的所有样本进行均值为0,标准差为1的标准化,缓解下层网络难以学习的问题。训练时是以当前批次为参考,推理是整个样本。BN一般用在图像分类中,LN是在NLP中。GN在检测中
发表于 2025-10-24 00:04:50
回复(0)
0
聪明的放鸽子能手allin实习
1.bn是batchnormalization,对某一个批次内所有样本进行均值为0,标准差为1的标准化,在训练时参考的是当前批次的样本,但是在推理时期,参考的是训练集所有样本的均值和标准差,ln一般用在nlp中,可以处理不同长度的向量
发表于 2025-09-19 16:15:25
回复(0)
0
牛客936040679号
BN的原理是由于数据的分布成正态分布,bn先用均值为0,方差为1的正态分布函数将一批次的数据控制到0-1之间,避免的数据的连续性被破坏,BN是在图像处理中使用,LN一般是在自然语言处理中使用
发表于 2025-09-11 17:07:42
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
来自:
机器学习应用-牛客面经八股
难度:
4条回答
11收藏
119浏览
热门推荐
相关试题
你实际用过哪些学习率策略?为什么要...
评论
(0)
来自
机器学习应用-牛客面经八股
Paraformer 有什么优势、...
评论
(0)
来自
机器学习应用-牛客面经八股
Dropout 训练和推理阶段分别...
评论
(0)
来自
机器学习应用-牛客面经八股
Top‑k 和 Top‑p 采样你...
评论
(0)
来自
机器学习应用-牛客面经八股
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题