通常lr缩放倍数为batch size倍数的开方。例如batch size增大4倍,学习率对应扩大2倍即可。

相关推荐

牛马人的牛马人生:太舒服了接接接
点赞 评论 收藏
分享
04-18 21:21
佛山大学 Java
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务