蚂蚁借贷部门数据研发一面0915

意外的,没有手撕代码环节。总共40分钟过程比较轻松。

(30分钟)

1.自我介绍

2.针对实习项目a(订单类型的新项目)进行提问:业务逻辑是什么?

3.项目a的dwd层主要干了啥?

4.项目a的数据主体域是什么?

5.为什么这么设计项目a的数据模型?

6.如果发生数据倾斜,订单表在哪发生的?

7.大表join的时候怎么处理数据倾斜?

8.hive分区和分桶的区别?

9.OLAP引擎和OLGP引擎?

10.如果有多个看板,如何保证多个看板的结果一致?

11.如果DWS层有个新维度是基于老维度的,需要进行修改,该怎么修改同时不影响别的表?

12.接11,三个老维度和一个新维度(由三个老维度组成)在dws上的区别?

13.实习项目b中复杂的spark函数是哪些?

14.实习项目b为什么用这些spark函数?

15.数据质量方面在公司用什么保障数据质量?

16.复盘在实习中遇到的数据产出延迟问题。

17.你自评协调合作能力强,在实习中能具体讲讲吗?

后面有点唠家常了,10分钟

18.怎么本科学网络安全,现在学计算机技术,但是投的是数据开发?

19.实习中组里氛围怎样?

20.你是哪里人?

反问:

业务细分、部门情况、工作作息、未来发展方向、面试几轮、对校招生的预期。

全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务