26届数开岗 -小厂实习面经
#26届实习[话题]#
广州奇点云小厂(100-499)面经-数开岗
两个人面,都比较友好,没有给压力
#面经# #找实习#
1.自我介绍
2.讲了一下项目(用了哪些技术栈)
3.数据倾斜
4.小文件处理
5.Spark为什么快
6.hive内部表外部表区别,(如果想删除外部表以及内部数据怎么做)
7.MapReduce执行过程
8.orc存储格式,除了orc还有什么格式,什么区别
9.为什么要分层,分层好处
10.有用过Python处理数据吗,Python的pandas库和numpy库,常用函数
11.hive动态分区
12.行转列,列转行,说了一下思路
13.简单的手撕SQL,统计累计值,开窗实现
半个小时左右,问了一下主营业务,现在过去能参与到数据治理的项目,Python实现比较枯燥,写一些文档,这个项目搞完会有数仓的项目,但是实习不了太长时间,可能没办法参与到数仓项目里。
说第二天上午再聊聊,二面。
广州奇点云小厂(100-499)面经-数开岗
两个人面,都比较友好,没有给压力
#面经# #找实习#
1.自我介绍
2.讲了一下项目(用了哪些技术栈)
3.数据倾斜
4.小文件处理
5.Spark为什么快
6.hive内部表外部表区别,(如果想删除外部表以及内部数据怎么做)
7.MapReduce执行过程
8.orc存储格式,除了orc还有什么格式,什么区别
9.为什么要分层,分层好处
10.有用过Python处理数据吗,Python的pandas库和numpy库,常用函数
11.hive动态分区
12.行转列,列转行,说了一下思路
13.简单的手撕SQL,统计累计值,开窗实现
半个小时左右,问了一下主营业务,现在过去能参与到数据治理的项目,Python实现比较枯燥,写一些文档,这个项目搞完会有数仓的项目,但是实习不了太长时间,可能没办法参与到数仓项目里。
说第二天上午再聊聊,二面。
全部评论
在哪里投的简历呀
相关推荐
昨天 22:40
吉林大学 Java 点赞 评论 收藏
分享
点赞 评论 收藏
分享