首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
期待一个好结果吧
上海交通大学 算法工程师
发布于上海
关注
已关注
取消关注
mark
@SweetBean:
算法岗常见面试题(六):优化器
学习资料(讲的很细很清楚):一个框架看懂优化算法之异同 SGD/AdaGrad/AdamAdam那么棒,为什么还对SGD念念不忘 (3)—— 优化算法的选择与使用策略(1条消息) 机器学习11种优化器推导过程详解(SGD,BGD,MBGD,Momentum,NAG,Adagrad,Adadelta,RMSprop,Adam,Nadma,Adamx)_日拱一两卒的博客-CSDN博客_机器学习优化器总结优化器的作用:更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值,从而最小化(或最大化)损失函数。发展路径:SGD -> SGDM -> NAG -> AdaGrad -> AdaDelta / RMSProp -> Adam -> Nadam -> AdamW发展阶段:没有动量:梯度下降<计算所有样本的梯度平均> / SGD<随机选择一个样本计算梯度> / 小批量随机梯度下降<每次处理一批样本>一阶动量(惯性):SGDM<梯度更新方向由历史梯度更新方向和当前梯度更新方向共同决定> / NAG<假设参数先按上一轮梯度更新方向变化,再计算当前梯度更新方向> 二阶动量(自适应学习率):AdaGrad<迄今为止所有梯度的平方和> / AdaDelta / RMSProp<只关注过去一段时间内的梯度更新频率> 一阶动量+二阶动量:Adam<SGDM+AdaDelta> / Nadam<NAG+AdaDelta> / AdamW<Adam+L2正则化>各种优化器如何选择刚入门选NAG或Adam如果模型非常稀疏,优先考虑自适应学习率的算法随机梯度下降算法的收敛速度和数据集大小的关系不大。因此,可以先用一个具有代表性的小数据集进行实验,测试一下最好的优化算法,然后通过参数搜索的方式寻找最优的训练参数。等等。BERT使用的优化器是什么?Adam相较于传统的SGD的优点是什么?(超参数一面)BERT使用的是Adam优化器。Adam结合SGDM和AdaDelta两种优化算法的优点。对梯度的一阶动量(惯性)和二阶动量(更新频率)进行综合考虑,计算出更新步长。一阶动量的优势在于他能够学习到历史梯度下降的惯性,避免受到单个样本分布的干扰,减少震荡,加快收敛;二阶动量的优势在于是自适应学习率,为参数的不同维分配不同的学习率,在模型稀疏的情况下效果很好。PS:Notion的笔记复制过来格式会变,这次就用截图吧,希望能看清楚。。。
点赞 14
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
不愿透露姓名的神秘牛友
05-31 19:05
又因为选offer吵架了
端午节去找女朋友了,但是聊到未来的时候又吵架了,好心累啊,这半年都是在吵架,因为春招offer我签约了北京,女朋友是杭州富二代,她希望我可以去上海或者杭州工作,但是我在那边也没有合适的机会,所以最后只能选择北京了,女朋友说不想异地恋,感觉我没有认真思考过我俩的未来,哎、其实我也不想异地恋,我说先在北京奋斗一下,有合适的机会我会去找她,目前北京的offer是在我能力范围内能拿到最好的了,不知道牛友们是不是和我一样,我觉得还是要先有一些经济基础,我想有个好的工作好的薪资,才能在她家人面前更有底气一些,但是却被她这样说 ,我可能也许真的像她说的那样吧,感觉人生真的好难,没有能十全十美的时候
真九字:
男人一定要以自己的事业为重,事业不好的话时间一长,爱情也会变质,况且你也难以在她家人面前抬起头。人活一辈子,就是要争一口气,物质上丰裕了,被别人瞧不起天天阴阳怪气,有啥意思。还不如自己打拼事业呢,至少你自己有底气这是你靠自己挣来的,对谁说话都有底气。什么,为什么我说这么多?就是因为我见过真实案例!
选offer应该考虑哪些因素
点赞
评论
收藏
分享
05-28 14:23
门头沟学院 基带工程师
很可笑吧,拍毕业照但没有想合影的人
打这些字的时候我已经逃离了拍摄现场,只拍完了集体合照。现场人群窜动,各自的小团体,各自的打算。而我至始至终就像一只扎眼的刺猬,低头看着手机掩饰自己的尴尬,期待着集体合照赶紧结束好离开,因为我知道在这个学校里,我没有任何一个可以称之为“小团体”的东西,我没有想合影的人。因为从大一刚进这个学校起,我就没有认真对待这个学校,我讨厌这里,这里也没有可以称之为“志同道合”的人,若即若离的的舍友关系也没什么好留念的。一个人总比跟不合拍的人待在一起要好。而现在,我终于毕业了,终于可以离开这里了,在这个学校里所带来的一切都彻底抛却,接下来是人生的新阶段。
牛客414065333号:
几个月后再看班群就一个说话的都没有了,再过几年搞不好根本不联系了。同学都是出现在生命中一小段时间的路人。哪怕以前很铁的同寝室哥们,也是工作的工作,读书的读书,以后也很难碰面了。毕业三年的老登表示,根本不需要在意这些
晒一下我的毕业照
点赞
评论
收藏
分享
04-22 21:08
门头沟学院 嵌入式软件工程师
新手有入门大礼包么
新手27届日常实习是这么找的么
待现的未见之事:
起码第一句要把自己的优势说出来吧。比如什么xx本27届学生,随时到岗....
我的求职精神状态
如果可以,你希望哪个公司来捞你
点赞
评论
收藏
分享
05-23 20:59
湖南工商大学 Java
26届后端实习,接下来该咋办
前面醒悟的太晚了,学的也太慢了,以至于真的没学什么东西,简历写的太烂了,现在是不知道改怎么走了,特来请教一下各位大佬,有没有好心人给一点建议,😭要转去干别的吗?还是再花时间在后端上,写项目,再继续学?还有一个数字马力的校招机会,还有两轮,或者准备数字马力?
影中藏刀:
看得出你准备的真的很少,不过去年在这个时候我还在学ssm呢,比我要好得多呢,肯定有机会的呢,努力成为八股文战神吧
投递数字马力等公司6个岗位
点赞
评论
收藏
分享
05-29 12:15
北京理工大学 整车软件集成工程师
有时候听取前辈的建议还是很不错的!(工作跳槽版)
最近刚刚换了工作,但是我工作年限真的很短很短,和新的mt去吃饭的时候,她跟我讲了一些她的意见,对于我来说是非常有用的,我来分享给大家,针对工作的年限如果自身不够硬的话就要在一个阶段足够的淬炼自己,方可进化成为职场no.1一个人的事业发展一般可以分几个阶段:第一阶段: 干活小弟(1-3年)干活小弟主要承接老板交代的工作,工作不需要承担太多责任,为老板打杂打下手,没有什么话语权,是学习技能的阶段第二阶段:大头兵(3-5年)这个时候你从一个执行小弟,变成一个可以独当一面的骨干专家。可以从执行者变成一个决策者,自己承担项目的闭环,需要拥有一些全局观和推动力。第三阶段:小组长(4-8年)从一个个人贡献者...
小涵干货小课堂
如果公司降薪,你会跳槽吗?
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
你的经历比较单薄, 但简历又弥补了这一点--双非仔个人简历分享
2606
2
...
字节last day,知无不言!
2338
3
...
六月还有机会的,对吗?
2188
4
...
发现27282届的同学怎么越来越卷了,投个票看看相互的进度吧
1641
5
...
只有收到offer那一刻是开心的
1313
6
...
25 暑期实习&秋招面经
1085
7
...
记录一下选择
1028
8
...
怎么包装实习经历呢
986
9
...
答辩时被导师当着所有人的面阴阳
937
10
...
为什么我的mos管驱动电路总是不听话?(上-基本原理总结)
807
创作者周榜
更多
正在热议
更多
#
写给毕业5年后的自己
#
7017次浏览
123人参与
#
今年形式下双非本找得到工作吗
#
133897次浏览
1008人参与
#
华泰证券Fintech星战营
#
190810次浏览
279人参与
#
职场捅娄子大赛
#
334504次浏览
3372人参与
#
你的秋招第一场笔试是哪家
#
128541次浏览
1399人参与
#
一人一个landing小技巧
#
65071次浏览
1007人参与
#
材料专业就业可以去哪些企业岗位
#
32838次浏览
314人参与
#
汇川技术求职进展汇总
#
120861次浏览
809人参与
#
产品2023笔面经
#
51169次浏览
441人参与
#
哪些公司笔/面试难度大?
#
2561次浏览
19人参与
#
硬件应届生薪资是否普遍偏低?
#
70214次浏览
506人参与
#
我想象的工作vs实际工作
#
470848次浏览
4781人参与
#
今年的你投递了多少份简历才上岸
#
33536次浏览
117人参与
#
通信硬件人社招/春招/实习投递现状
#
24962次浏览
922人参与
#
实习中的菜狗时刻
#
349676次浏览
3219人参与
#
考公VS就业,你怎么选?
#
58675次浏览
393人参与
#
总结:哪家公司面试体验感最差
#
55796次浏览
262人参与
#
工作后会跟朋友渐行渐远吗
#
25822次浏览
191人参与
#
机械人的薪资开到多少,才适合去?
#
107805次浏览
445人参与
#
你的论文盲审过了没?
#
103128次浏览
1468人参与
#
考公还是考研,你怎么选?
#
26036次浏览
131人参与
牛客网
牛客企业服务