懂车帝数据开发面经

1.自我介绍

2.你的项目是***吗?)(是的)

3.你项目中的职责是?

4.你项目的数据是网上开源带的模拟数据吗?

5.项目里都有哪些表?

6.你口述一下七天内连续下单的思路

7.介绍一下另一个项目

8.数据迁移过程中数据丢失了的原因有没有想过?

(我写了我迁移很多表)

9.其他高级语言能力呢? 答:用java比较多

(回头听录音才发现这个大问题,感觉寄了

因为一面的面试官跟我说过他们用python!)

10.聊聊自定义函数

11.聊聊spilt函数的应用(我举了个具体的需求来回答)

12.spilt函数拓展怎么保证顺序?

(我说spilt没有顺序,搞顺序可以collect_list套一个sort_array)

13.聊聊分区表和分桶表?

14.分桶表怎么设置???

(我就说是在insert into table.....后面

那堆设置里面写,具体写法我忘了)

15.聊聊order by与sort by

16.你能实习多久?

17.你说说你对数据仓库的理解

(我直接说我自己的理解,没背八股)

你有什么想问我的吗?

反问:

1.具体工作内容

2.你们数据口径这一块怎么管理(我其实是想了解一下

大厂的数据口径能不能统一起来,因为之前我面试被

问到怎么统一数据口径)

心得:

全程25min,好像是组长还是主管面的,但是我感觉主管不太期待我的表现,很多问题都问很浅,不深入问我。我回头复盘的时候总感觉自己表现很差,还得努力,继续沉淀!!!

技术总结:

1.hive一些基础操作一定要滚瓜烂熟,hive的自定义函数再深入深入

2.项目要吃透,尤其是sgg,sgg最经典也最具代表性,可以换位思考一下我是面试官“你连sgg都聊不明白,一步一步喂着做的项目都做不好,我凭什么用你。”

3.多面试的好处是可以提前在前面面试了解他们用什么架构对哪方面技术感兴趣,比如一面面试官已经告诉我用python,hive,那我完全可以准备一些这方面的知识,面试时不经意间引导面试官往这方面问,然后答出早就准备好的答案

#面经##大数据开发面经##大数据面经#

全部评论
1 回复 分享
发布于 2024-12-29 11:53 湖南
用电脑写的文章,所以排版可能有差错
1 回复 分享
发布于 2024-12-27 19:48 湖北
👍
点赞 回复 分享
发布于 03-12 11:03 山东
佬几个项目呀,就sgg离线数仓那一个吗
点赞 回复 分享
发布于 01-17 19:50 陕西
佬,那个10的那个自定义函数是udf吗,udf不知道怎么从哪方面答
点赞 回复 分享
发布于 01-12 10:54 安徽
请问楼主,SGG是什么意思呀?求解释
点赞 回复 分享
发布于 01-04 13:55 上海
有一面面经吗
点赞 回复 分享
发布于 2024-12-29 20:24 广东

相关推荐

接上篇。🗓微软-MAI-Software Engineer Intern2/6投递,2/14收到问卷,2/26面邀,3/11一面挂。微软面试流程和阿里国际相似,先把所有人放在大池子里进行一面,后续再根据面试表现及匹配度分配岗位的具体方向。由于投递的部门是MAI,所以面试官看重简历是否与AI强相关,包括论文科研等,Coding考察的是用栈实现队列,以及一道智力算法题。用栈实现队列基本ac,但是智力算法题没想出来。一面挂。🗓亚马逊○Business Intelligence Engineer Intern:2/7投递,2/10简历挂。○Software Dev Engineer Intern:2/7投递,2/11收到OA邀约,2/12完成OA,由于OA的Coding三题均只通过60%测试用例,2/14挂。○System Development Engineer Intern:2/7投递,2/14收到OA邀约,2/16完成OA,Coding全部AC,但是最后2/24挂,可能是因为workstyle部分与公司文化不匹配,亚马逊比较看重这个。🗓Shoppee-大数据开发工程师3/13投递,3/14笔试邀约,3/20笔试挂。笔试部分考察408,以及三道算法,一道SQL。算法题只通过60%,笔试挂。🗓阿里国际-Bravo102实习生计划3/29投递,3/31面邀+测评+笔试邀约,4/3一面。同上,阿里国际和微软面试流程相同,先进池子一面再细分,所以面试基本围绕简历进行,整体聊的比较好,但是由于本人乱做在线人才测评,后面撤回笔试,一面挂。    
点赞 评论 收藏
分享
评论
10
25
分享

创作者周榜

更多
牛客网
牛客企业服务