淘宝面试SQL—「首单且最高单」订单分析

题目描述

现有一张淘宝购物订单明细表 dwd_tb_order_di,字段如下:

  • user_id:用户ID
  • order_id:订单ID
  • amt:订单金额
  • order_time:下单时间
  • dt:分区日期(yyyyMMdd)

查询每个用户在每天(按 user_id, dt 分组)满足以下条件的订单:

  1. 该订单是用户当日的第一笔订单(order_time 最早)
  2. 同时该订单还是用户当日的最高金额订单(amt 最大)

若用户当日“首单”不是“最高单”,则该用户当天不返回任何记录

数据模拟

DROP TABLE IF EXISTS dwd_tb_order_di;

CREATE TABLE dwd_tb_order_di (
  user_id    VARCHAR(20) NOT NULL COMMENT '用户ID',
  order_id   VARCHAR(20) NOT NULL COMMENT '订单ID',
  amt        DECIMAL(10,2) NOT NULL COMMENT '订单金额',
  order_time DATETIME NOT NULL COMMENT '下单时间',
  dt         CHAR(8)  NOT NULL COMMENT '分区日期yyyyMMdd'
);

INSERT INTO dwd_tb_order_di (user_id, order_id, amt, order_time, dt) VALUES
('001', 'A1', 500, '2025-02-01 10:00:00', '20250201'),
('001', 'B1', 200, '2025-02-01 11:00:00', '20250201'),
('001', 'C1', 100, '2025-02-01 12:00:00', '20250201'),
('001', 'D1', 400, '2025-02-01 13:00:00', '20250201'),
('002', 'A2', 300, '2025-02-01 10:00:00', '20250201'),
('002', 'B2', 200, '2025-02-01 11:00:00', '20250201'),
('002', 'C2', 400, '2025-02-01 12:00:00', '20250201'),
('003', 'A3', 300, '2025-02-01 10:00:00', '20250201'),
('003', 'B3', 200, '2025-02-01 11:00:00', '20250201');

思路分析

这题的关键是:同一用户同一天,要同时满足“最早一单”和“最高一单”为同一条记录。

可拆解为 3 步:

  1. 按 user_id, dt 分区,对订单按 order_time 升序排列,打上「首单标记」rn_first=1
  2. 同分区对订单按 amt 逆序排列,打上「最高单标记」rn_max=1
  3. 同时满足 rn_first = 1 AND rn_max = 1 的就是答案(如果不存在则不返回)

参考答案

SELECT
  user_id,
  dt,
  order_id,
  amt,
  order_time
FROM (
        SELECT
            user_id,
            dt,
            order_id,
            amt,
            order_time,
            ROW_NUMBER() OVER (PARTITION BY user_id, dt ORDER BY order_time ASC) AS rn_first,
            ROW_NUMBER() OVER (PARTITION BY user_id, dt ORDER BY amt DESC) AS rn_max
          FROM dwd_tb_order_di
) t
WHERE rn_first = 1
  AND rn_max = 1
ORDER BY user_id, dt;

#我的求职总结##数据人的面试交流地##今天你投了哪些公司?#
大厂高频面试SQL题 文章被收录于专栏

收录字节、阿里、蚂蚁、美团、京东、百度、小红书、拼多多等大厂面试SQL题

全部评论
可以的,SQL面试大部分都考
点赞 回复 分享
发布于 03-13 23:10 北京

相关推荐

头像
03-03 15:53
已编辑
黑龙江大学 Java
在当前开源项目极为丰富的背景下,付费资源并不一定意味着最前沿的技术优势,在具体执行层面展示出自己的独特价值,才是简历上最重要的加分项。1. WebMCP — 让网站主动告诉 AI 该怎么操作AI 操作浏览器的方案一直靠"猜"——截图识别、DOM 解析,错误率 15-30%。WebMCP 反过来,让网站自己声明能做什么,AI 直接调用结构化接口,准确率接近 100%。Chrome Canary 已实装。企业内部系统的 WebMCP 适配目前几乎没人做,是明确的蓝海。推荐理由:简历上写的不是"我会用某个框架",而是"我在标准刚发布时就做了企业适配&...
书海为家:#人脑vsAI# 尽管深度学习的最初灵感来源于人类的大脑,但二者的运作方式截然不同:深度学习所需要的数据量远比人脑所需要的多得多。可是一旦经过大数据训练,它在相同领域的表现将远远超过人类(尤其是在数字的量化学习,例如挑选某人最可能购买的产品,或从100万张脸中挑选最匹配的一张)——相对来说,人类在同一时间内只能把注意力放在少数几件事情上面,而深度学习算法却可以同时处理海量信息,并且发现在大量数据背后的模糊特征之间的关联,这些模糊特征不仅复杂而且微妙,人类往往无法理解,甚至可能不会注意到。 虽然深度学习拥有人类所缺乏的并行处理海量数据的“绝技”,但不具备人类在面对决策时独一无二的汲取过去的经验、使用抽象概念和常识的能力。 与人类相比,深度学习想要充分发挥作用,离不开海量的相关数据、单一领域的应用场景以及明确的目标函数,这三项缺一不可,如果缺少其中任何一项,深度学习将无用武之地。
AI求职实录
点赞 评论 收藏
分享
评论
1
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务