反问紧张了:腾讯广告算法二面

✅一面
 1、数据集构成 
2、最长的点击文章序列长度
 3、为什么选用DIN模型,介绍下DIN
 4、DIN跟传统神经网络DNN CNN区别
 5、DIN是拿哪些信息训练的 
6、LGB只用了统计特征吗,已有embedding,为什么不用深度模型呢 
7、LGB输出的是什么,它的预测分数是什么 
8、DIN的输出和预测分数是什么
 9、加权融合部分怎么做的,权重怎么定,为什么DIN高
 10、为什么不用LGB和DIN的结果(DNN之前)做拼接再softmax,而是在外面做加权融合呢
 11、u2i是自己做的还是模型自动做的
 12、相似度矩阵具体怎么做的
 13、有了解过FM吗,为什么不用FM或者自适应的特征交叉之类呢
 14、最后拿到的结果是什么样的,和第一名的差距如何
✅反问:
 1、广告推荐的场景--所有广告的推荐
 2、具体负责的工作--提升广告和用户的匹配度和匹配效率,偏向广告主侧
 3、实习生培养模式--课程、带做项目,短周期输出校验
 4、建议--学原理,深度优先
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。

全部评论

相关推荐

一面(面试官很好!很有耐心!)1.spark中rdd叫弹性分布式数据集,这个弹性的含义2.小文件的危害以及怎么处理3.spark中宽依赖、窄依赖4.stage的划分5.kafka怎么保证数据不重复消费(没回答上,但说了怎么重复消费数据)6.checkpoint机制7.spark的三种join(boardcast join,sort merge join,shuffle hash join)7.四道sql(前两道很简单,第三道次日留存和七日留存,第四道连续登录问题)8.算法题:移动最少区间个数 使得剩余区间无重叠1. 输入:[1,2][2,3][4,6][1,3]2. 输出:13. 解释:移除[1,3]后,剩余区间无重叠(面试后在牛客网看见有人分享这道算法题)一面最后面试官还问我以后的计划,我说打算先实习明年春招边实习边找工作,她居然问我没想留着字节吗(我当然想!)中间有些问题没想起来,耗时1小时40分钟二面(面试官很好!问的都是和数仓相关的,结合我的实习问)1.之前工作都干了什么2.之前实习搭建数仓的结构3.了解事实表吗,了解维度表吗4.怎么和其他人对接的5.你属于风控部门,但主要是构建数仓开发,那有没有和其他数据开发人员交流过6.你只有一段实习吧,那实习前后有什么感悟吗7.为什么要选择数据开发(我说因为之前实习是干数仓的,他说不要因为之前干什么就觉得以后三十年干什么,实习还是丰富点,看看干什么)8.最后反问二面耗时50分钟,感觉面试官对我回答的第七个问题不满意,只是我明年要毕业了,得多来一份垂直的实习建议多复习spark、hive方面的八股文、概念问题,实习生主要负责离线数仓开发
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
06-25 17:22
有无友友推荐Java 好的项目的知识星球呀  打广告的不要来
程序员小白条:你本质上还是跟做的话,加任何星球都没啥用,主要还是能够自己在项目上拓展,所以最好是全栈
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务