蚂蚁借贷部门数据研发一面0915
意外的,没有手撕代码环节。总共40分钟过程比较轻松。
(30分钟)
1.自我介绍
2.针对实习项目a(订单类型的新项目)进行提问:业务逻辑是什么?
3.项目a的dwd层主要干了啥?
4.项目a的数据主体域是什么?
5.为什么这么设计项目a的数据模型?
6.如果发生数据倾斜,订单表在哪发生的?
7.大表join的时候怎么处理数据倾斜?
8.hive分区和分桶的区别?
9.OLAP引擎和OLGP引擎?
10.如果有多个看板,如何保证多个看板的结果一致?
11.如果DWS层有个新维度是基于老维度的,需要进行修改,该怎么修改同时不影响别的表?
12.接11,三个老维度和一个新维度(由三个老维度组成)在dws上的区别?
13.实习项目b中复杂的spark函数是哪些?
14.实习项目b为什么用这些spark函数?
15.数据质量方面在公司用什么保障数据质量?
16.复盘在实习中遇到的数据产出延迟问题。
17.你自评协调合作能力强,在实习中能具体讲讲吗?
后面有点唠家常了,10分钟
18.怎么本科学网络安全,现在学计算机技术,但是投的是数据开发?
19.实习中组里氛围怎样?
20.你是哪里人?
反问:
业务细分、部门情况、工作作息、未来发展方向、面试几轮、对校招生的预期。