滴滴-国际化数据部-大数据开发二面面经
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习
1. 自我介绍
2.八股文
- hive的数据类型有哪些
- hive中计算排名前N的函数有哪些
- hive的优化手段你知道哪些
- 遇到过数据倾斜吗
- mapjoin如何开启,参数是什么
3.SQL题
rt_ data表存放了当天每半小时的店铺销售数据,表名: rt_ data,字段名: shop id (店铺id),stat date (时间) , ord_ amt(销售额)。找出昨天10点各店铺的销售金额及前半小时的销售金额和后1个小时的销售金额。
思路:(开窗函数,lead和lag)
4.数仓理论
- 谈谈你对数仓的理解
- 你们的数仓是怎么分层的,为什么要对数仓进行分层
- 介绍一下你做的离线数仓的数据全链路