牛客700359186号

2020-08-17 13:01 已编辑苏州大学算法工程师

关注

携程nlp算法一面

携程面试 #携程面试#
携程算法nlp面试
新鲜的携程nlp面试
我是没有笔试，直接面试的，hr发邮件那天我就点了改期，但是她一直没回我
到了今天面试时间，我又怕面试官没通知到位，我就点进链接一看，发现人家已经上线等我
于是有了史上最短15分钟面试
对不起人家直通面试的机会，也是自己还没准备充分
对着简历问了，将项目内容，任务
BERT预训练前期怎么处理
Self attention 原理

然后就还问我有几个offer ？0 offer怎么回
然后就写了一个题目就是两个用户浏览了机票几次，电影票几次，怎么求相似度建模

最后就到了死亡一问，我还有什么问题要问他的，我也不知道我还有啥问题问他
这如何回答
对不起你们，我当分母了

#面经##算法工程师##校招#

全部评论

推荐最新楼层

南昌市职工科技大学 Java

楼主携程一面以后有后续吗

点赞回复分享

发布于 2020-09-03 09:18

同济大学算法工程师

携程算法一共几面呀，目前刚面了二面，估不准会不会过二面

点赞回复分享

发布于 2020-08-28 17:06

秋秋给个offer吧

电子科技大学算法工程师

难受，面了30多分钟凉了，问了几个问题没答上来

点赞回复分享

发布于 2020-08-17 16:30

牛客881777877号

上海交通大学算法工程师

我也刚面完，感觉略微草率😑

点赞回复分享

发布于 2020-08-17 14:48

牛客社区助手006

北京警察学院运营

楼主你好，请问你是实习、校招还是社招？

点赞回复分享

发布于 2020-08-17 10:58

04-22 16:22

南京理工大学 C++

职位&企业询问

想问一下入职大佬对以下几个企业的评价，其中有已经到手了，有流程比较快的，感觉offer 考虑期还是太短了QAQ，想了解一下这些公司职位，感觉有些公司小红书啥的搜出来没有什么具体信息爱奇艺ios北京  波克城市 游戏开发（微信小游戏组） 上海 完美世界 服务器 北京  多乐游戏  游戏开发 北京 联想 嵌入式 北京  小米 软件开发 南京   金山办公 C++开发 深圳  4399 游戏开发 广州  东风日产 新技术管培 广州 小黑盒 后端开发 北京  大梦龙途 客户端 深圳拼多多 C++ 上海 字节就不说了都第五面了，能进进不能进拉倒，上海的目前是抖音ios的流程，不知道有没有大只佬评价一下，感觉很暴雷啊      

爱奇艺工作体验联想求职进展汇总

点赞评论收藏

分享

不愿透露姓名的神秘牛友

04-18 14:37

秋招春招经历

bg  双九硕，做视觉的秋招oc的：烽火  软件海康  算法途虎养车  算法百信银行  风控百度  aigctplink  视觉中电科网安华测导航  算法春招oc的：滴滴  地图华为  昇腾小米  广告爱奇艺  三面结束去百度了，本来想找个搜广推的，但是都不太好，其实给的最多的是途虎但是拒了

点赞评论收藏

分享

04-21 10:44

南京邮电大学前端工程师

爱奇艺实习体验怎么样

前端开发base上海长宁区，有没有实习搭子可以捞一捞 #实习＃

点赞评论收藏

分享

04-17 11:15

爱奇艺面经

一面问八股和挖项目经历怎么实现分布式锁？消息队列对分布式问题的解决方案？对账出问题怎么解决？大流量下怎么保证高并发？跟第三方支付接口对接具体细节？如果数据结构不一致怎么处理？数据库底层？事务隔离级别？事务是不是越多越好？事务传递？Spring 注解了解吗？然后问了几个注解问题然后手写了一个业务场景题，简单实现对账系统，考察业务思维和遍历对账数据的算法，主包最开始对客户数据和实际数据直接遍历两次，面试官说有没有遍历一次能解决问题的，最后搞定了二面问的内容其实差不多，只是深度和广度的区别，也是围项目和技术栈，八股比较少了，挖业务更多一点三面线下面就是正常终面问题，挑战成就 讲一个技术难题怎么解决的之类的   

爱奇艺三面2人在聊

查看14道真题和解析

点赞评论收藏

分享

05-01 19:10

中山大学算法工程师

为什么现在 LLM 很少使用 Dropout了？

翻遍各种大模型的实现，虽然结构上可能保留了 dropout 的实现，但是采样概率都设置为 0 了。唯一一个比较新的，还用 Dropout 的模型是 Meta 训练的 Galactica 模型。那为什么现在不用了呢？核心还是要弄清楚 Dropout 的使用场景。Dropout 之前在深度学习当中是一个特别好用的方法，可以防止过拟合，提高泛化。所以说，当模型较大，数据较少的时候，使用 Dropout 是比较合适的。现在大模型处在什么状态呢？✅预训练在预训练阶段，目前可能还是处于欠拟合的状态。之所以说可能，是基于目前公开的一些论文的出的结论。但是现在闭源的公司在采用大量数据合成的情况下，已经训练足够充分或者接近充分也说不定。以 llama 一系列论文为例，训练 llama 1 的时候，龙猫 Scaling law 里面提到 GPT3 是一个训练很不充分的模型。然后给出的数据配比的建议是，10B 的模型要采用 200B 的 token 来训练。但是 llama 1 采用了 7B 的模型，训练量 1T 的 token 发现性能依然有提升。而且预训练所有的语料一般只过一个 epoch，某些特定的领域可能过 2个 epoch，可以认为样本的重复率很低。所以，在数据足够多，多样性足够而且没有太多重复的情况下，大模型在预训练阶段仍然没有过拟合的风险。也就完全不需要采用 dropout。✅Dropout 就完全不需要了么？如果上面的条件不能满足，Dropout 还是有用武之地的。比如前面提到的 Galactica 模型。这个模型和其他大模型不太一样的地方是训练了 4.25 个 epoch，因为他们认为高质量的数据更重要一些，但是又没有那么多，所以就 repeat 数据了。在论文《To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis》 中，详细列举了数据 Repeat 对训练 LLM 的影响，并且证明了 Dropout 可以缓解数据重复带来的性能损失。在文章《Can LLMs learn from a single example?》中，也提到了在 SFT 的时候，少量的重复数据就会降低模型的性能。这也符合常理，SFT 的数据分布和预训练的通常是不太一样的，重复的数据会让模型拟合新的分布，从而忘掉旧的分布。文中同样也提到 Dropout 可以缓解数据重复带来的影响。所以 Dropout 在数据量较少，多样性不高，需要 repeat 的场景下，依然是一个减少过拟合的很方便的手段。比如现在已经有一些在 LoRA 微调的时候采用 Dropout 的研究了。      

简历中的项目经历要怎么写

点赞评论收藏

分享

评论

1

15

招聘动态

交银金科

2026届秋季招聘

26届投递链接合集

华泰Fintech星战营

全站热榜

更多

华为开奖进度👉

热聊中

创作者周榜

更多

正在热议

更多

# 职场捅娄子大赛 #

368964次浏览 3765人参与

# 什么专业适合考公 #

32081次浏览 207人参与

# 写给毕业5年后的自己 #

13340次浏览 240人参与

# 秋招被确诊为…… #

157876次浏览 715人参与

# 安克创新求职进展汇总 #

35647次浏览 425人参与

# 找实习你看重大厂光环还是业务方向 #

10733次浏览 86人参与

# 软开人，秋招你打算投哪些公司呢 #

97523次浏览 925人参与

# 你的房租占工资的比例是多少？ #

29534次浏览 333人参与

# 考研对你找工作产生了哪些影响？ #

16740次浏览 148人参与

# 蚂蚁求职进展汇总 #

104893次浏览 1112人参与

# 机械人怎么评价今年的比亚迪 #

54652次浏览 183人参与

# 计算机专业还有必要去大厂卷吗 #

23193次浏览 120人参与

# 你最满意的offer薪资是哪家公司？ #

27364次浏览 148人参与

# 你觉得技术面多长时间合理？ #

94948次浏览 690人参与

# 每人推荐一个小而美的高薪公司 #

74567次浏览 1364人参与

# kpi面有什么特征 #

41290次浏览 329人参与

# 工作压力大怎么缓解 #

82531次浏览 948人参与

# 秋招提前批启动你开冲了吗 #

119606次浏览 1908人参与

# 打杂的实习你会去吗？ #

111912次浏览 973人参与

# 牛友打假中心 #

90380次浏览 2652人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务