字节商业化数据科学校招:更新3轮面经

一面
1. 给非技术背景的同事解释CUPED方差缩减法(因为我简历提到了)

2. 介绍一个使用因果推断的场景,(答节日大促的DID),如何拟合虚拟平行宇宙?(合成控制法) 

3. 抖音大促活动后,发现男性和女性的投诉率分别都提高了,但综合起来总体却没有提高。为什么,举出数字例子。 

4. 如果一个活动结束后,极端投诉率降低了,能不能得出结论说明用户体验整体变好了?如何验证用户差评率是否真的下降? 

5. SQL题:统计连续三天下单美妆产品的用户 

6. 最常用的2个APP,(回答小红书和抖音)。对于预测用户是否会点赞某条内容,你认为xhs和抖音哪个会更准确?

7. 三个门里有一个门背后有奖品,你选了一扇门,这时主持人打开另一扇门发现是空的,你该不该换门?
 追问:有种说法,如果你选了一扇未中奖的门,那么主持人一定会打开另一扇未中奖的门,相当于暗示你没中奖,这个时候换门就代表中奖了。请你指出这个说法的问题。

二面
形式上主要是对一面的问题进行延伸
1. CUPED模型遇到了什么困难,怎么解决的
2. 使用CUPED模型时,有没有遇到其他额外的数据处理方法
3. 计算题:两个人抛硬币,先抛到正面的人赢,假设你第一个抛硬币并且在第N轮赢,求N的数学期望。(具体记得不是很清楚,反正是等比数列求和问题)
4. 描述做过的一个因果推断项目。用来解决什么业务问题?(跟一面问的是同一个东西,但挖得更深入)
5. 如何拟合不存在的对照组?
6. 因果推断中,如何保证实验上线后的对照组情况真实可信?(答案:实验上线期间不要在对照组做任何其他实验,尽可能避免节日等大型活动)

三面(感觉面得不是很好)

问的是之前面试没问过,但简历上出现过的其他技术名词
1. 介绍Word2vec的模型原理、数学公式,以及解决到了什么问题。
2. 解释朴素贝叶斯模型。
3. 贝叶斯公式,以及每一项代表什么。
4. 估计深圳市的私家车数量。

前两轮面试过了都是一个小时内出通知,三面过了两天还没有通知,所以盲猜挂了。确实三面后2小时内还有作业ddl,所以状态不是很好。不过美国这边已经收到其他公司offer,准备接了哈哈哈哈。

#字节跳动# #数据科学# #面经# #秋招#
全部评论
大佬base哪里?
1 回复 分享
发布于 2023-11-16 20:18 英国
最常用的2个APP,(回答小红书和抖音)。对于预测用户是否会点赞某条内容,你认为xhs和抖音哪个会更准确? 估计深圳市的私家车数量,| 请问这道题什么思路呢!顺便问问楼主最后拿offer了吗
点赞 回复 分享
发布于 2023-11-19 11:46 美国
礼貌问下是商业变现吗
点赞 回复 分享
发布于 2023-11-05 21:37 上海
数据分析的面试题好抽象
点赞 回复 分享
发布于 2023-11-05 14:34 山东
怎么验证4 啊
点赞 回复 分享
发布于 2023-11-05 11:08 北京
第三题怎么做,没思路捏
点赞 回复 分享
发布于 2023-11-04 10:06 北京

相关推荐

Tom哥981:让我来压力你!!!: 这份简历看着“技术词堆得满”,实则是“虚胖没干货”,槽点一抓一大把: 1. **项目描述是“技术名词报菜名”,没半分自己的实际价值** 不管是IntelliDoc还是人人探店,全是堆Redis、Elasticsearch、RAG这些时髦词,但你到底干了啥?“基于Redis Bitmap管理分片”是你写了核心逻辑还是只调用了API?“QPS提升至1500”是你独立压测优化的,还是团队成果你蹭着写?全程没“我负责XX模块”“解决了XX具体问题”,纯把技术文档里的术语扒下来凑字数,看着像“知道名词但没实际动手”的实习生抄的。 2. **短项目塞满超纲技术点,可信度直接***** IntelliDoc就干了5个月,又是RAG又是大模型流式响应又是RBAC权限,这堆活儿正经团队分工干都得小半年,你一个后端开发5个月能吃透这么多?明显是把能想到的技术全往里面塞,生怕别人知道你实际只做了个文件上传——这种“技术堆砌式造假”,面试官一眼就能看出水分。 3. **技能栏是“模糊词混子集合”,没半点硬核度** “熟悉HashMap底层”“了解JVM内存模型”——“熟悉”是能手写扩容逻辑?“了解”是能排查GC问题?全是模棱两可的词,既没对应项目里的实践,也没体现深度,等于白写;项目里用了Elasticsearch的KNN检索,技能栏里提都没提具体掌握程度,明显是“用过但不懂”的硬凑。 4. **教育背景和自我评价全是“无效信息垃圾”** GPA前10%这么好的牌,只列“Java程序设计”这种基础课,分布式、微服务这些后端核心课提都不提,白瞎了专业优势;自我评价那堆“积极认真、细心负责”,是从招聘网站抄的模板吧?没有任何和项目挂钩的具体事例,比如“解决过XX bug”“优化过XX性能”,纯废话,看完等于没看。 总结:这简历是“技术名词缝合怪+自我感动式凑数”,看着像“背了后端技术栈名词的应届生”,实则没干货、没重点、没可信度——面试官扫30秒就会丢一边,因为连“你能干嘛”都没说清楚。
点赞 评论 收藏
分享
12-27 22:28
门头沟学院 Java
点赞 评论 收藏
分享
评论
13
43
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务