字节大数据开发(广告业务)

首先自我介绍,然后
I.上来就是两道中等的sql题目:
1.SELECT
  CASE 
    WHEN name_count > 1 THEN CONCAT(d.name, s.name)
    ELSE s.name
  END AS display_name
FROM (
  SELECT sp.*, COUNT(*) OVER (PARTITION BY sp.name) AS name_count
  FROM student_profile sp
) s
JOIN department d ON s.department_id = d.id;
唯一记录的一条sql,我感觉有小问题,但是感觉面试官很急。我想改他直接说赶紧下一个。

为什么select里面用的别名不能直接用到同一个语句中,我回答sql执行顺序的问题,以及在hive中会报错,未找到相应的名字。他笑了,我的回答错了???whatever

III. 考了spark shuffle 的过程,非常的细节,怎么给partition分区?我的回答:spark.default.parallelism,通常等于集群的 CPU 核心数,默认值为 200。或者读取文件时指定分区数。然后这里他又笑了,内心os:这位大佬是微笑大使。

IV. 他让我直接写ods 和 dwd 层建模的过程!这一考法我有点不理解要考什么,有木有大佬给我解答一下
(感谢)。虽然我写了一部分,但是有的还是忘了。

V. 考了我HTTP中reception的作用,不知道这里是不是我听错了,我说能再说一遍吗?他说没时间了,今天就这样吧。

总结:自我介绍我太简略了?我想着他手上有我的简历,他好像对我的实习经历有点不感兴趣,因为他说我介绍的时候都是业务层面的?

Interview time:One Hour
中间还有一些,我就没写了。。。

#如何判断面试是否凉了##大家都开始春招面试了吗##数据人的面试交流地##牛客AI配图神器#
全部评论
ods建模流程与数据源(比如mysql)保持一致就可以了,如果是mysql同步过来的话,mysql字段有什么名字,你ods模型就有什么名字,直接搬过来;dwd建模流程就是基于业务过程的事实动作和度量,从模型建设五要素(数据域,粒度,事实表,维度,度量)建设
1 回复 分享
发布于 04-27 14:58 安徽
spark.default.parallelism这个参数默认是200,跟集群cpu个数没啥关系吧,用集合创建rdd默认并行度是集群cpu个数,也可以参数自己指定,文件创建rdd可以指定。分区个数应该是shuffle算子可以在括号内自己修改下游分区个数,以及重分区算子coalesce/repartition
1 回复 分享
发布于 04-27 14:55 安徽
佬是哪个部门?国际商业化已oc(感觉也是广告)
点赞 回复 分享
发布于 04-30 19:55 广东
佬 能看看简历么 。 我也大数据开发想参考下。还有就是咱大数据开发 redis 事务锁这些要掌握么。8股不是很清楚背哪些,有偿可以说一下么
点赞 回复 分享
发布于 04-16 23:29 山东
请问有结果了吗佬
点赞 回复 分享
发布于 04-16 19:44 广东
大佬,结果如何
点赞 回复 分享
发布于 04-16 15:33 贵州
面了多久啊,感觉问的是常规问题
点赞 回复 分享
发布于 04-15 18:12 天津

相关推荐

一面(面试官很好!很有耐心!)1.spark中rdd叫弹性分布式数据集,这个弹性的含义2.小文件的危害以及怎么处理3.spark中宽依赖、窄依赖4.stage的划分5.kafka怎么保证数据不重复消费(没回答上,但说了怎么重复消费数据)6.checkpoint机制7.spark的三种join(boardcast join,sort merge join,shuffle hash join)7.四道sql(前两道很简单,第三道次日留存和七日留存,第四道连续登录问题)8.算法题:移动最少区间个数 使得剩余区间无重叠1. 输入:[1,2][2,3][4,6][1,3]2. 输出:13. 解释:移除[1,3]后,剩余区间无重叠(面试后在牛客网看见有人分享这道算法题)一面最后面试官还问我以后的计划,我说打算先实习明年春招边实习边找工作,她居然问我没想留着字节吗(我当然想!)中间有些问题没想起来,耗时1小时40分钟二面(面试官很好!问的都是和数仓相关的,结合我的实习问)1.之前工作都干了什么2.之前实习搭建数仓的结构3.了解事实表吗,了解维度表吗4.怎么和其他人对接的5.你属于风控部门,但主要是构建数仓开发,那有没有和其他数据开发人员交流过6.你只有一段实习吧,那实习前后有什么感悟吗7.为什么要选择数据开发(我说因为之前实习是干数仓的,他说不要因为之前干什么就觉得以后三十年干什么,实习还是丰富点,看看干什么)8.最后反问二面耗时50分钟,感觉面试官对我回答的第七个问题不满意,只是我明年要毕业了,得多来一份垂直的实习建议多复习spark、hive方面的八股文、概念问题,实习生主要负责离线数仓开发
点赞 评论 收藏
分享
评论
2
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务