首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
求offer的猫头鹰很漂亮
2024-09-14 07:26
门头沟学院 C++
发布于上海
关注
已关注
取消关注
秋招捞人
上海字节 美团 b站有没有好心人可以捞一下我,进度一直在初筛,岗位方向是算法推理引擎😁
全部评论
推荐
最新
楼层
牛客599676869号
Нижегородский государственный технический университет им. Р. Е. Алексеева C++
这还不明白吗,没hc了
点赞
回复
分享
发布于 2024-09-14 09:11
上海
暂无评论,快来抢首评~
相关推荐
04-29 14:44
上海交通大学 C++
暑期实习offer帮选
投票
👋个人背景:security方向硕士👏offer1:高德-算法工程师-安全算法。主要做风控类的工作,最近在用大模型agent做漏洞挖掘,base北京,作息10-9-5。优点是跟硕士方向很匹配,进去感觉直接是舒适区,转正率高,部门内部人员很稳定,有很多十年老员工。但秋招不考虑北京的岗位所以去基本是镀金。💯offer2:美团-大模型算法工程师。部门业务是做数字人直播,作息10-8-5。优点是base上海,而且新兴业务发展潜力比较大。缺点是新兴业务容易整个部门裁掉..🌱offer3:vivo-安全算法。部门业务是做整个v厂的隐私合规和风险控制算法,作息9-6-5。硬件厂的共同优点是相对不卷,缺点是面试的感觉是进去很难学到东西。
投递美团等公司6个岗位
点赞
评论
收藏
分享
05-01 19:10
中山大学 算法工程师
为什么现在 LLM 很少使用 Dropout了?
翻遍各种大模型的实现,虽然结构上可能保留了 dropout 的实现,但是采样概率都设置为 0 了。唯一一个比较新的,还用 Dropout 的模型是 Meta 训练的 Galactica 模型。那为什么现在不用了呢?核心还是要弄清楚 Dropout 的使用场景。Dropout 之前在深度学习当中是一个特别好用的方法,可以防止过拟合,提高泛化。所以说,当模型较大,数据较少的时候,使用 Dropout 是比较合适的。现在大模型处在什么状态呢?✅预训练在预训练阶段,目前可能还是处于欠拟合的状态。之所以说可能,是基于目前公开的一些论文的出的结论。但是现在闭源的公司在采用大量数据合成的情况下,已经训练足够充分或者接近充分也说不定。以 llama 一系列论文为例,训练 llama 1 的时候,龙猫 Scaling law 里面提到 GPT3 是一个训练很不充分的模型。然后给出的数据配比的建议是,10B 的模型要采用 200B 的 token 来训练。但是 llama 1 采用了 7B 的模型,训练量 1T 的 token 发现性能依然有提升。而且预训练所有的语料一般只过一个 epoch,某些特定的领域可能过 2个 epoch,可以认为样本的重复率很低。所以,在数据足够多,多样性足够而且没有太多重复的情况下,大模型在预训练阶段仍然没有过拟合的风险。也就完全不需要采用 dropout。✅Dropout 就完全不需要了么?如果上面的条件不能满足,Dropout 还是有用武之地的。比如前面提到的 Galactica 模型。这个模型和其他大模型不太一样的地方是训练了 4.25 个 epoch,因为他们认为高质量的数据更重要一些,但是又没有那么多,所以就 repeat 数据了。在论文《To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis》 中,详细列举了数据 Repeat 对训练 LLM 的影响,并且证明了 Dropout 可以缓解数据重复带来的性能损失。在文章《Can LLMs learn from a single example?》中,也提到了在 SFT 的时候,少量的重复数据就会降低模型的性能。这也符合常理,SFT 的数据分布和预训练的通常是不太一样的,重复的数据会让模型拟合新的分布,从而忘掉旧的分布。文中同样也提到 Dropout 可以缓解数据重复带来的影响。所以 Dropout 在数据量较少,多样性不高,需要 repeat 的场景下,依然是一个减少过拟合的很方便的手段。比如现在已经有一些在 LoRA 微调的时候采用 Dropout 的研究了。
简历中的项目经历要怎么写
点赞
评论
收藏
分享
04-10 19:44
南京大学 算法工程师
求助,选大模型or搜广推…
研一在读,本硕C9,实验室做的是cv相关的工作,但是显卡资源很少。未来可能考虑大模型或者搜广推方向,目前无实习无论文,导师给的指导很少,大佬们推荐一下该选哪个方向…
牛客916098993号:
搜推常青树只需要卷实习就够了,llm现在就有卷论文的趋势了,实习难找的一批。换我回到研一就走搜推算了,泪啊。
点赞
评论
收藏
分享
04-29 20:03
复旦大学 C++
拼多多信息确认
今天晚上看到好多16号以后HR面的uu们收到了信息确认,问了两位uu,HR都是xl,这个和HR有关吗?有uu的HR是yly而且收到了信息确认码
拼多多求职进展汇总
点赞
评论
收藏
分享
04-11 15:38
美团_后端开发(实习员工)
暑期offer选择
投票
有点标题党了,其实u1s1不叫选择,因为已经决定去团子了,毕竟是第一个收留我的,但我今天下午刚收到携程的oc,然后是做风控的,就有点好奇风控是做啥的,大家会怎么选
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
1
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
挑战 26 届最速转正失败——我做错了什么
3.1W
2
...
我的校园恋爱正式结束了
1.2W
腾讯暑期补捞
热聊中
3
...
25的兄弟们还在战斗吗?
1.1W
4
...
从后端的角度聊一聊:2728届想要搞开发的同学现在最应该干什么?
8760
5
...
坐我后面的妹妹被拉走了!!
8594
6
...
毕业照和春招结束代表着我的学生时代落幕了
7277
7
...
好想加班好想加班,啊啊我的钱(っ╥╯﹏╰╥c)
6668
8
...
双非大一百度timeline
6288
9
...
秋招提前上岸,这个机会真的不错!建议大家冲!
4979
10
...
26届找不到暑期实习也不必太焦虑!!!!
4927
创作者周榜
更多
正在热议
更多
#
写给毕业5年后的自己
#
1650次浏览
30人参与
#
上班苦还是上学苦呢?
#
220811次浏览
1308人参与
#
华泰证券Fintech星战营
#
166272次浏览
188人参与
#
职场捅娄子大赛
#
305307次浏览
3068人参与
#
市场营销人求职交流聚集地
#
115839次浏览
1078人参与
#
华为求职进展汇总
#
4632039次浏览
28207人参与
#
如何缓解求职过程中的焦虑?
#
4396次浏览
72人参与
#
如果今天是你的last day,你会怎么度过?
#
20610次浏览
188人参与
#
好好告别我的学生时代
#
22711次浏览
458人参与
#
薪资爆料
#
107718次浏览
1156人参与
#
运营商笔面经互助
#
145239次浏览
1622人参与
#
晒一下我的毕业照
#
25287次浏览
231人参与
#
外包能不能当跳板?
#
31266次浏览
201人参与
#
非技术求职现状
#
424809次浏览
2924人参与
#
简历无回复,你会继续海投还是优化再投?
#
69004次浏览
697人参与
#
你的实习什么时候入职
#
248401次浏览
1890人参与
#
记录实习开销
#
16054次浏览
109人参与
#
我是XXX,请攻击我最薄弱的地方
#
26681次浏览
256人参与
#
宇通求职进展汇总
#
19860次浏览
162人参与
#
运营来爆料
#
43407次浏览
323人参与
#
00后45度躺现状
#
94111次浏览
489人参与
牛客网
牛客企业服务