充分认识到自己多辣鸡了。分享一下面经并欢迎回复解答。 batchnorm的几个参数,能不能整合到前面的conv里,训练时和测试时的区别 感受野计算 3*3,s=1与5*5,s=2的核在无限大(即不用考虑padding)的feature map上卷积计算的计算量之比 解释一下sgd的momentum 算法题:非常大的两个数组,一个是人的id(unique,无序),一个是浮点型身高值。一一对应。要求返回top m身高及对应的id。约束条件:1. 这m个身高和id的顺序必须是数组原状态的顺序。2. 空间复杂度O(1),时间不作要求。 softmax和cross ent...