拼多多数据分析面经

如何理解“辛普森悖论”?请你设想一个在拼多多电商业务中,可能会出现辛普森悖论的具体场景。

追问: 作为数据分析师,当你发现汇总数据和分层数据得出了完全相反的结论时,你会如何处理?你认为应该相信哪个结论,并如何向业务方解释这个现象?

使用了“多多支付”的用户,其年化消费金额显著高于使用其他支付方式的用户。我们能直接得出“多多支付促进了用户消费”的结论吗?

追问: 如果不能,你会如何设计一个分析方案,来更科学地推断“使用多多支付”和“高消费”之间的因果关系,而不仅仅是相关性?

通过A/B实验来评估一个新的、基于大模型的“智能客服”系统能否提升用户满意度,但“用户满意度”是一个长期且多维的指标。你会如何设计这个实验?

追问1: 你会选择哪些短期可观测的指标作为核心评估指标?你会设立哪些护栏指标来确保新系统没有带来负面影响(例如,问题解决时长、人工介入率等)?

追问2: 如果实验涉及到用户间的社交互动(例如,用户分享了与AI客服的有趣对话),可能会产生网络效应或实验单元间的干扰,你会如何处理?

假设“百亿补贴”频道的核心指标——“补贴商品的GMV”本周环比下跌了15%。请你用逻辑树的方法,将这个指标的下跌,层层拆解到可归因、可分析的细分维度上。

描述你的SQL查询逻辑,如何找出那些“在过去90天内,至少有3次购买行为,且平均购买间隔小于7天,但最近14天内没有任何活跃”的“高价值流失风险”用户。

构建一个模型,用于预测一个商品是否会成为“爆款”(例如,未来30天内销量进入品类TOP 1%)。你会如何进行特征工程?

追问: 你会从哪些维度(例如,商品自身属性、店铺特征、用户行为、历史趋势等)去提取特征?你认为哪些特征可能最重要?

除了传统的RFM模型,如何利用无监督学习,从用户海量的行为数据中,挖掘出一些全新的、有商业价值的用户分群?

追问: 在你得到这些分群结果后,你会如何去“解读”和“标记”这些新的人群,并向运营团队提出针对性的运营策略建议?

全部评论

相关推荐

头像 会员标识
09-13 21:41
已编辑
滴滴_算法实习生(实习员工)
秋招好像还没结束,但对我来说已经差不多了。211本科985硕士,没论文,非科班出身,这几个标签凑在一起,大概就不该妄想挤进算法岗。想想自己真是走错了好多路。高中搞信息竞赛,大学继续打ACM,虽然最后只是区域赛打铁水平,零零星星只能拿几个蓝桥杯国奖。本科不是计算机专业,靠着那点竞赛底子,保研时也没能挤进985的科班。还被现在被导师忽悠了。他说搞人工智能,我以为是CV/NLP,结果他说的AI是遥感图像处理用的ANN。实验室的服务器甚至有的没有显卡,导师连Python环境都不会配置,整天嚷嚷让学生标注数据。暑假那会儿面C++开发还挺顺利,拿了五六家大厂offer。阴差阳错去做了算法实习,因为时间问题也没能转正。那时候听说AI infra是个方向,想着大模型推理总需要写C++的人吧,就把简历项目都往这个方向靠。问过业内前辈,说技术栈确实相通。还是太天真了。八月底才开始投简历,各大厂连面试都不给。笔试倒是发了一些,大部分都能AK,但做完就石沉大海。总共就面了不到五家公司,全是小厂,倒是给了offer,但总觉得差口气。研究生读得本就痛苦,导师PUA,毕业要求还高。抑郁吃了一年的药才康复。有时候半夜改简历,看着项目经历里那些自己捣鼓的推理优化,忽然觉得可笑——可能我这种半路出家的,本来就不该碰瓷算法岗。可能最难受的是,明明高中就开始写代码,写了这么年算法题,最后连个面试机会都挣不到。导师还在催毕业论文进度,而我连工作都没定下来。要是当初老老实实去做开发就好了。要是没被导师忽悠就好了。要是早点认清自己不是搞算法的料就好了。也许明年春招该回去投C++开发了。只是偶尔还会想起,在实习公司跑通第一个模型的那天下午,显示器里的loss曲线一直在下降,就像我的人生曲线一样,不知道什么时候才能收敛。可惜没要是。
你的秋招简历被谁挂了?
点赞 评论 收藏
分享
评论
2
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务