小红书数据平台数开一面0919
60分钟,是个说话非常温柔的小哥哥,压力一点都没有,一直在表扬。
40分钟问实习
1.讲讲实习项目a业务逻辑(分为商家-平台-用户三个视角)
2.刚才说商家视角,业务上细节问题
3.平台视角,站外流量主和广告主关系
4.用户视角,下单享用评价返现的设置
5.设置佣金比例,在业务逻辑上该怎么设置,才能三方互赢(业务思考)
6.如果产出时间低于预期,怎么处理
7.对于数据安全质量方面,DQC如何配置,才能体现对数据仓库的思考
8.你觉得数据仓库对公司业务带来的价值是哪些(开始蒙蔽,但是答得还行)
9.如果有新的转化事件,为了不冗余,怎么处理(加个统一的归因模型)
5分钟反问
1.业务范围:也是广告相关
2.作息时间(比较卷,但是绝对有收获,校招生提升很大)
3.base地:是喜欢的杭州
15分钟手撕
表:Logs
+---------------+---------+
| Column Name | Type |
+---------------+---------+
| log_id | int |
+---------------+---------+
id 是上表具有唯一值的列。
上表的每一行包含日志表中的一个 ID。
编写解决方案,得到 Logs 表中的连续区间的开始数字和结束数字。
返回结果表按照 start_id 排序。
结果格式如下面的例子。
示例 1:
输入:
Logs 表:
+------------+
| log_id |
+------------+
| 1 |
| 2 |
| 3 |
| 7 |
| 8 |
| 10 |
+------------+
输出:
+------------+--------------+
| start_id | end_id |
+------------+--------------+
| 1 | 3 |
| 7 | 8 |
| 10 | 10 |
+------------+--------------+
解释:
结果表应包含 Logs 表中的所有区间。
从 1 到 3 在表中。
从 4 到 6 不在表中。
从 7 到 8 在表中。
9 不在表中。
10 在表中。