搜广推算法岗面经

今天老师给大家梳理了部分大厂搜广推算法岗面试真题,供各位同学参考学习。
1.PPNet的核心思想是什么?为什么要 stop gradient ?什么时候不需要这样操作?
2.多目标模型很容易遇到跷跷板问题或者两个 loss 数量级相差很大,优化速度差异太大,你知道有什么优化方法吗?
3.NEG loss 和 NCE loss 有什么区别? infonce loss 公式是什么
4.召回业务一般怎么定义负样本? bce loss 的公式是什么?简述一下 Pointwise , pairwise 和 listwise 的区别是什么?召回一般用什么 loss ?
5.粗排的作用?怎么验证粗排精排的链路一致性?用什么指标可以衡量链路一致性?
6.大模型了解吗?怎么在推荐中应用?比如怎么在召回中用?大模型训练分成哪几个阶段?简述一下各个阶段在干什么
7.千万级别的整型数组,怎么获取其中出现次数最多的前 N 个数?(考数据结构)8.讲一下你知道的机器学习里面的算法,比如 AdaBoost , GBDT , XGBoost 这些。 Bagging 和 Boosting 的区别?随机森林是什么
9.讲一下Word2vec是怎么做的?怎么降低计算复杂度?
10.你知道的中心极限定理有哪些?
11.双塔模型优势和缺点,怎么改进?
12.粗排的目的是什么?有哪些指标,粗排应该向精排看齐吗?
13.说一下 BN 的公式,哪几个参数是在训练时更新,在推理时还更新吗?简述一下测试过程中的 BN 怎么算。 BN 和 LN 的区别?
14.当神经网络的权重初始化为0时,会遇到什么问题?
15.你能抽象地归纳出序列建模发展的脉络吗?以及它的最终形态应该是什么样子?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
好难啊,感觉我找算法没希望了
1 回复 分享
发布于 04-27 08:38 陕西

相关推荐

一面(面试官很好!很有耐心!)1.spark中rdd叫弹性分布式数据集,这个弹性的含义2.小文件的危害以及怎么处理3.spark中宽依赖、窄依赖4.stage的划分5.kafka怎么保证数据不重复消费(没回答上,但说了怎么重复消费数据)6.checkpoint机制7.spark的三种join(boardcast join,sort merge join,shuffle hash join)7.四道sql(前两道很简单,第三道次日留存和七日留存,第四道连续登录问题)8.算法题:移动最少区间个数 使得剩余区间无重叠1. 输入:[1,2][2,3][4,6][1,3]2. 输出:13. 解释:移除[1,3]后,剩余区间无重叠(面试后在牛客网看见有人分享这道算法题)一面最后面试官还问我以后的计划,我说打算先实习明年春招边实习边找工作,她居然问我没想留着字节吗(我当然想!)中间有些问题没想起来,耗时1小时40分钟二面(面试官很好!问的都是和数仓相关的,结合我的实习问)1.之前工作都干了什么2.之前实习搭建数仓的结构3.了解事实表吗,了解维度表吗4.怎么和其他人对接的5.你属于风控部门,但主要是构建数仓开发,那有没有和其他数据开发人员交流过6.你只有一段实习吧,那实习前后有什么感悟吗7.为什么要选择数据开发(我说因为之前实习是干数仓的,他说不要因为之前干什么就觉得以后三十年干什么,实习还是丰富点,看看干什么)8.最后反问二面耗时50分钟,感觉面试官对我回答的第七个问题不满意,只是我明年要毕业了,得多来一份垂直的实习建议多复习spark、hive方面的八股文、概念问题,实习生主要负责离线数仓开发
点赞 评论 收藏
分享
一面:全部 30min,全是项目,没有算法1. 自我介绍2. 说个你的最难的点?怎么解决的?3. 指标为什么推送到文档里?有没有考虑过推送群里?4. 接口重构是怎么做的?为什么旧接口返回的数据不能变更?以 app 为例?5. 慢 SQL 是怎么发现的?怎么治理的?6. 你的幂等注解应用场景是什么?7. 幂等是解决什么问题的?8. 如果流量激增,对后端服务做水平扩展,怎么保证扩展的节点不会打垮其他中间件,比如数据库或者 Redis?开启本地缓存,实例扩展时分批次同步 redis 数据,这样既能分摊 mysql 又能分摊 redis。9. 实习有用到定时任务吗?是怎么保证不被重复执行的?加到 mq;每个节点设置选择区间;10. 怎么排查问题的?es 搜索+本地机器搜索+代码定位11. 日志平台原理是什么?es 同步本地机器日志文件12. 让你设计个日志平台,不采用 es 方案,你怎么设计?业务日志代码直接打到大数据工具里,使用流式处理而不是 es 再同步。13. 有了解过大数据相关组件吗?没有14. 反问:主要使用语言?golang+python15. 反问:有几轮面试?两轮技术面其他记不得了,两小时后约第二天二面。总结:大数据方面的设计面试官很满意,后面没写算法直接给过了======================================================================二面:全程 55min,项目 20min,算法 30min,反问 5min1. 自我介绍?2. 闲聊:家乡、为什么读本校的研?3. 讲下实习的架构?4. 实习的业务流程探讨?5. 你们怎么应对风控的?6. 慢 SQL 怎么发现的?怎么治理的?7. Java 的参数传递是值传递还是引用传递?没有引用传递吗?8. 父类的方法是 protect,子类可以是什么?9. 你这两个练手项目的与别人不一样的点在哪里?10. 幂等怎么做的?你这个似乎是限流不是幂等?侧重点不一样,应该根据业务改11. 为什么要使用到延迟队列?防止高峰期消费者或数据库造成瓶颈。12. 算法:93. 复原 IP 地址?写的比较慢,步长不好控制13. 对职业的规划是什么?14. 对于互联网很卷,35 岁危机怎么看?15. 反问:具体业务是什么?16. 反问:公司用到什么框架?自研总结:二面感觉答得不是很好,但是面试官还是给通过了
查看28道真题和解析
点赞 评论 收藏
分享
评论
2
21
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务