关注
说一个很novel的观点……
bn一般用在图像上,当我们对图片抽取特征后,会得到不同通道的特征,这些通道特征对batch内样本具有同样的含义。例如一个人有年龄,身高等特征。而nlp中,如果要进行bn,则是对不同句子的第i个token进行处理,举个例子"我爱你"和"牛客网",其中的我和牛并没有相同的含义,所以解释不通。还有一个点就是你所说的每个句子长度不同,对于短句子我们需要pad,那么如果进行bn就需要将pad.和长句子中的token进行处理,这样也是不合理的。
查看原帖
3 评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
12-07 21:08
北京科技大学 Java 点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 对2025年忏悔 #
1337次浏览 20人参与
# 联影求职进展汇总 #
165118次浏览 831人参与
# 实习没人带,苟住还是跑路? #
6936次浏览 150人参与
# 非技术岗简历怎么写 #
274861次浏览 3168人参与
# 元旦假期你打算怎么过 #
4637次浏览 120人参与
# 春招前还要继续实习吗? #
1619次浏览 27人参与
# 你做过哪些dirty work #
25058次浏览 155人参与
# 妈妈治愈了你哪些脆皮时刻 #
38408次浏览 338人参与
# 面试官问过你最刁钻的问题是什么? #
3654次浏览 55人参与
# 大家实习都在做什么? #
6109次浏览 61人参与
# 一人说一家双休的公司 #
3630次浏览 58人参与
# 毕业论文怎么查AI率 #
70118次浏览 1941人参与
# 运营面经 #
148955次浏览 1329人参与
# 我来点评面试官 #
37667次浏览 163人参与
# 我们是不是被“优绩主义”绑架了? #
6566次浏览 216人参与
# 实习/项目/竞赛奖项,哪个对找工作更重要? #
102537次浏览 1185人参与
# 牛客2025仙途报告 #
29139次浏览 379人参与
# 职场中对你有帮助的书 #
25709次浏览 216人参与
# 查收我的offer竞争力报告 #
264401次浏览 1650人参与
# 面试等了一周没回复,还有戏吗 #
192042次浏览 1660人参与
