shopee 算法 面经

头铁投算法,小小期待一下hr面吧,虽然概率不大,如果得到hr面通知就来更新二面面经
==================================================================
一面:(记不全了,感觉面了很久很久,挑记得住的写)
1.自我介绍
春招就投了shopee一家,太久没说自我介绍都忘了说自己用的是什么算法了,最好还加了个自己的爱好。面试官憨憨一笑说:头一次听见有人自我介绍说爱好的~羞愧- -
2.因为强化学习与推荐不太匹配,不问项目了直接问题吧
问知不知道Auc,写一道题
答不知道,项目做的强化学习,对这方面都是按面经有啥准备啥,当时找的面经没提到Auc
但是面试官说没事,我给你讲,让我硬做(这里有个插曲,长春现在封寝,我笔试面试都赶上上门捅核酸,于是我做题时候就去做核酸了,回来我说做完了,面试官说做完了你写成代码阿,我说核酸做完了。。。。
题目:给两个列表,一个列表元素为1/0代表正/负样本,一个列表对应他们的概率,求Auc,Auc等于组合里面正样本打分高于负样本打分的组合个数/一正一负样本对的所有组合数
一开始算是暴力解法吧,面试官要时间复杂度O(nlogn),于是用排序+二分查找做的,结果跟暴力解法不一致,但面试官说思路可以代码写的也还行,下去自己调吧就过了
3.这期间问了一堆我听过但还没学到的:word2vec、XGboost、交叉熵...
我太菜了,当时交叉熵还没看过呢,面试官说这不应该是分类算法最简单的。。
下面是一些回答上来的问题,感觉面试官还觉得回答的不错
-->LR的损失函数是什么,我说叫logistic loss,面试官说不是,但是他的解释我记不清了,下来重新理解应该就是那个样本集概率取log似然值加负号(说错了请纠正我)
-->正则化方法都有什么
-->L1正则为什么具有稀疏性
-->为什么正则化能防止过拟合【我说对权重加约束,有的权重就没了】-->【没答上来】如果说L1能防止过拟合的原理是让权重没了,那L2呢?【我说限制权重取值范围,面试官显然不满意】
-->树的算法都了解哪些?答CART、随机森林、GBDT-->讲讲GBDT的思想
-->经验风险和结构风险都是什么?【回答的面试官也不满意,说原则上没错,但觉得没有说到根本】
4.一道情景题,【因为有些概念不太懂,勿喷,理解我大概要表达的意思吧】在推荐系统里,如果训练的时候标签1表示展示在页面用户点击了0代表用户未点击,该标签与模型得到的打分相关性很高,但测试时不高,为什么?
答我当时就懵住了。面试官引导我的例子我懂了,但后来他说因为推荐系统是优化每个人的List而不是整体的List,现在又有点不太懂了,是模型打分高代表用户愿意点的多,但实际测试时一个用户上线了就可能不点了嘛,因为这不是这个用户喜欢的?请大佬解答,感激不尽
5.最后面试官推荐我最近学点推荐有关的东西...我觉得凉凉无疑
6.反问
不过后来也有收到二面通知,希望大家一切顺利吧= =

#面试那些事##春招#
全部评论
你好!请问你在硕士期间有发表的论文吗?虾皮是否看重这一点呢?
1 回复 分享
发布于 2022-04-13 17:23
想问楼主shopee是base哪里呀
1 回复 分享
发布于 2022-04-04 22:59
问的问题基本都是一样的,该不会遇到同一个面试官了吧!
点赞 回复 分享
发布于 2022-04-06 19:42
楼主到hr面了吗
点赞 回复 分享
发布于 2022-04-03 20:09
楼主是本硕985吗
点赞 回复 分享
发布于 2022-04-02 14:14
楼主请问,是中文面试的吗?
点赞 回复 分享
发布于 2022-04-01 21:29

相关推荐

09-09 20:08
产品经理
📍 公司:虾皮(Shopee)💼 岗位:大数据开发工程师📅 面试时间线:7.30 一面8.4 二面8.8 收到感谢信(未通过)面试问题记录请介绍你实习中负责的数仓数据流向及核心业务场景。详细说明一个具体业务模块,包括所用技术栈与上下游用户。针对问题2中的业务,如何处理并发场景下的“不可重复读”问题?大数据技术栈掌握情况?重点提问 Spark 的使用经验。如何优化实际 Spark 任务?请举例(如数据倾斜、Shuffle 优化)。描述快速排序算法的基本思想(穿插在数据倾斜优化中考察基础)。是否遇到过数据写错的情况?若数仓数据写入 Kafka 错误,如何修复?➤ 进一步追问:HDFS 数据已错,但 Kafka → 业务表已生效,如何保证一致性与服务可用性?若需从某个 Kafka Topic 消费数据并入库数仓,你会如何设计流程?(开放性问题)🙌 面试感悟虽为实习经历深挖,但问题贴近真实生产场景,尤其关注高可用、数据一致性、容错与恢复机制;对数据链路的闭环理解要求较高,需清楚“从出错到修复”的全链路影响;建议提前准备:✅ 典型数据倾斜解决方案(如加盐、两阶段聚合)✅ Kafka 重放与幂等写入策略✅ 数仓分层中各层容灾与回溯能力设计📌 C端业务对数据质量与系统稳定性要求高,面试更倾向考察“出问题后怎么办”的应急思维。
查看9道真题和解析
点赞 评论 收藏
分享
评论
12
61
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务