通常lr缩放倍数为batch size倍数的开方。例如batch size增大4倍,学习率对应扩大2倍即可。
牛客网
牛客网在线编程
牛客网题解
牛客企业服务