字节跳动数据科学一面面经

自我介绍

简历深挖:

完整地介绍项目:项目背景、遇到的问题、你是怎么解决的、最终效果怎么样、以及怎么去度量它的价值

然后是疯狂的拷打:质疑建模维度的实际应用价值,模型的提升大概有多大,XGB的优势RF也有为什么不选RF等等

A/B测试

1. 做A/B test时,如果发现结果不显著,可能是什么原因导致的?

2. 针对这些原因,有什么解决办法?或者如何提前避免、事后补救?

3. 如何判断结果不显著具体是哪一个原因导致的?

4. (针对样本量不足)样本量应该增大到多少?我们怎么去做一个估算?

5. 如果是分流不平均(抽样不均)的情况,应该怎么解决?

6. 如果在某个特征上发现非常不均匀,有什么好的处理办法吗?

7. 具体说一下“协变量调整”是怎么调整的吗?

8. 你觉得分层抽样能解决单一维度采样不均的问题吗?它不能解决的方面是哪些?

业务场景题

1. 我们想判断抖音视频流里的广告密度多大是合理的,你会怎么做?需要了解哪些数据来做这个判断?

2. 假设你需要的这些数据(用户停留时长、广告点击率等)都有了,你如何基于这些数据去分析,并判断应该提升还是降低广告密度?

3. 实验结果很可能是广告越多,收入越高,但用户体验越差。依据这个趋势,你怎么判断应该选择哪一个广告密度策略?这个平衡点怎么找?

4. 用户体验和商业收入之间的“价值”怎么做兑换?如何进一步确定这个量化关系?

#发面经攒人品#
全部评论

相关推荐

评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务