快手数据研发凉经
1h10 min
面试官是个大佬,全程面试偏场景题
八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件
场景题:
快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播
有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决
雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用过
上层埋点时如果出现时间不一致怎么解决(什么玩意,不会)
离线数仓的实时性了解吗?(没太听懂面试官的点)但还是答了自己理解
为什么实时数仓现在还是在企业里无法完全替代离线数仓?
FLINK的缺点知道吗(不太了解)
手撕3个sql:比较简单,经典连续登录,留存率,left join 问题,全搞出来了
反问:面试表现:基础尚可,但缺少实际的企业项目经验。(寄了)
面试官主要做的工作:管整个大数据组的,什么项目都做一点
鉴定为寄
面试官是个大佬,全程面试偏场景题
八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件
场景题:
快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播
有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决
雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用过
上层埋点时如果出现时间不一致怎么解决(什么玩意,不会)
离线数仓的实时性了解吗?(没太听懂面试官的点)但还是答了自己理解
为什么实时数仓现在还是在企业里无法完全替代离线数仓?
FLINK的缺点知道吗(不太了解)
手撕3个sql:比较简单,经典连续登录,留存率,left join 问题,全搞出来了
反问:面试表现:基础尚可,但缺少实际的企业项目经验。(寄了)
面试官主要做的工作:管整个大数据组的,什么项目都做一点
鉴定为寄
全部评论
我感觉面试官有病,要是有企业项目经验,那还是应届生吗
这跟我二面一模一样,怀疑是同一位面试官
几面呀
请问第一个场景题,开播流量大数据倾斜应该怎么解决呀~
为啥现在问的八股越来越难了😭
官网流程咋样。我这一直面试中
啥部门呀
相关推荐
05-05 12:57
门头沟学院 前端工程师
记着呢:说的很对,已经工作近7年,就是觉得年轻的时候太多忧虑,没有好好玩一玩,虽然现在我也是很多忧心事,但是真的感觉年轻的时光才是最宝贵的,玩的开心,做自己喜欢的事,全力以赴,这才是应该做的 点赞 评论 收藏
分享
