关注
在学习率默认1e-3的情况下,batchsize取100更好,10000太大了。正常来说batchsize肯定是越大收敛速度越快,大的batchsize需要的batch数目少,1个小时就可以训练完imageNet。而且大的batchsize梯度更稳定,loss曲线更平滑。但是如果batchsize过大,会导致效果变差(大的batchsize收敛到sharp minimum, 小的batchsize收敛到flat minimum,后者泛化能力更好)。论文中目前研究batchsize超过8000之后,效果就不好了。当然如果能够增大学习率,可能10000是最优的(因为样本量也挺大的)。我觉得面试官这个题目应该多给些条件,比如学习率固定为多少?
查看原帖
1 评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 我的求职总结 #
34613次浏览 554人参与
# 国企vs私企,怎么选? #
21366次浏览 172人参与
# 一人一个landing小技巧 #
40205次浏览 716人参与
# 你收到了团子的OC了吗 #
1318304次浏览 11650人参与
# 机械人值得去的国央企 #
60019次浏览 408人参与
# 辞职之后最想做的一件事 #
12474次浏览 176人参与
# 怎么防止在试用期被辞退 #
118897次浏览 891人参与
# 校招第一份工作你干了多久? #
68873次浏览 338人参与
# 选offer应该考虑哪些因素 #
24618次浏览 342人参与
# 联想工作体验 #
24372次浏览 166人参与
# 考公还是考研,你怎么选? #
24862次浏览 127人参与
# 毕业季,给职场新人一些建议 #
33083次浏览 531人参与
# 薪资一样,你会选择去大厂还是小公司 #
17313次浏览 106人参与
# 大厂还是考编 #
86888次浏览 1312人参与
# 为了秋招你都做了哪些准备? #
11475次浏览 173人参与
# 如果重来一次你还会读研吗 #
169482次浏览 1763人参与
# 你想吐槽公司的哪些规定 #
18485次浏览 71人参与
# 晒一晒你收到的礼盒 #
63433次浏览 378人参与
# 工作中的卑微时刻 #
9499次浏览 57人参与
# 为什么国企只招应届生 #
166466次浏览 1116人参与