百度提前批-数据基建专员-深圳
1.自我介绍
2.实习平时对接的业务方是谁
3.spark的数据倾斜优化
4.有用过python或者scala写过rdd级别的代码吗
5.spark调优的参数有哪些
6.报表用的什么数据库
7.sql题:region(地区,字符串类型)
department(部门,字符串类型)
product_line(产品线,字符串类型)
amount(金额,数值类型,如 Double) 如何用一个sql实现将这个三个维度的任意组合都实现的聚合
2.实习平时对接的业务方是谁
3.spark的数据倾斜优化
4.有用过python或者scala写过rdd级别的代码吗
5.spark调优的参数有哪些
6.报表用的什么数据库
7.sql题:region(地区,字符串类型)
department(部门,字符串类型)
product_line(产品线,字符串类型)
amount(金额,数值类型,如 Double) 如何用一个sql实现将这个三个维度的任意组合都实现的聚合
全部评论
补充一下
8.spark的执行过程
9.是否用到过数据湖
10.反问,这个部门是百度销售体系的数据开发团队,虽然岗位名字叫数据基建专员但其实和数据开发工程师干的活是一样的
相关推荐
09-01 18:54
广东财经大学 数据分析师 面试时间:15min面试官:HR面试问题:1.先做个自我介绍2.我们公司在xxx,能否接受这个地点,你的通勤时间大概是多久3.你下学期课程安排如何,每周确保能出勤多久4.薪资待遇、请假概况5.反问环节

点赞 评论 收藏
分享
点赞 评论 收藏
分享