百度提前批-数据基建专员-深圳
1.自我介绍
2.实习平时对接的业务方是谁
3.spark的数据倾斜优化
4.有用过python或者scala写过rdd级别的代码吗
5.spark调优的参数有哪些
6.报表用的什么数据库
7.sql题:region(地区,字符串类型)
department(部门,字符串类型)
product_line(产品线,字符串类型)
amount(金额,数值类型,如 Double) 如何用一个sql实现将这个三个维度的任意组合都实现的聚合
2.实习平时对接的业务方是谁
3.spark的数据倾斜优化
4.有用过python或者scala写过rdd级别的代码吗
5.spark调优的参数有哪些
6.报表用的什么数据库
7.sql题:region(地区,字符串类型)
department(部门,字符串类型)
product_line(产品线,字符串类型)
amount(金额,数值类型,如 Double) 如何用一个sql实现将这个三个维度的任意组合都实现的聚合
全部评论
补充一下
8.spark的执行过程
9.是否用到过数据湖
10.反问,这个部门是百度销售体系的数据开发团队,虽然岗位名字叫数据基建专员但其实和数据开发工程师干的活是一样的
相关推荐
点赞 评论 收藏
分享
淮竹c:不好意思,打扰大家🙏我是一个拼多多骑手,小电驴的最大电量为C,我的最大电量有1e9这么promax😭😭😭需要从x=0处走到x=L,L足足有1e9那么长处,途中有n个充电站,🙏🙏每个充电站的距离和电价分别为di和pi,初始电量是满的😭😭😭请告诉我到达终点最少要花多少钱😭😭😭求求大家把这些钱转给我
点赞 评论 收藏
分享