腾讯WXG数据工程一面0909

不愧是微信,压力很足了,比对线大师还出汗

这60分钟比抖音80分钟难熬多了,菜就多学

(15分钟+15分钟)上来就来2个编程题下马威:

1.动态规划的,给字符串a和数组b,如a='apple',b=['ap','pl','e'],其中b的每个元素可以多次使用或者不使用,问使用b能否构造出a。dp[j]=dp[i] and a[j:i] in set,做出来了。

2.SQL的,给定签到表sign,有三个字段,user_id,date,flag(1表示签到,0表示没签到),问截至目前每个用户签到的连续天数。这个写了半天,两三层嵌套没写出来,用了row_number()

20分钟:八股,鹅的八股都这么喜欢底层吗

3.广播join(噩梦开始)

4.小表left join大表的过程(按我的理解说了)

5.面试官:你说的4回答和3没什么区别啊,意思是广播join和小表left join 大表一样?(这口气肯定是不一样,但我不知道哪不一样)

6.我瞎答了个spark索引的问题,于是他追问spark做索引有什么优势呢?(不懂,应该是引导我不能说索引)

7.面试官:都到spark内存中了,索引重要吗?(已经是神志不清了)

8.我:sry,我最近了解的是spark3.0的函数,对于内部底层不了解,于是他问spark3.0的计算中位数函数(不熟)

9.spark数据倾斜(这个我会啊,巴拉巴拉)

10.什么算子会导致数据倾斜(憋底层了,不会,我随便回答了个group、join都有)

11.数据倾斜解决办法(我用实习项目的加盐)

12.加盐有问题,会导致关联不上,你怎么解决(还能这样?是菜鸡,没考虑过)

13.我解释是实习项目小文件过多,加盐可以解决,在join环节(希望别折磨了)

14.那join环境的问题咋解决(大表加盐打散成10份,小表复制10份,看来这个回答还让他挺满意)

15.非阻塞socket在linux(八股,开背)

16.原来的阻塞在哪里(内核调度中,等待资源的进程状态时)

17.非阻塞和epoll(八股,开背)

10分钟反问

业务:视频号会和多个小部门合作

技术栈:java,flink,spark,doris,scala

原来wxg在广州,但是大概率是寄了,吸取教训吧,只能说鹅还是太难了,全是底层。事前准备的实习项目是基本没问,抖音一面后准备的业务逻辑,项目复盘,ETL优化是一个没问,太难了,建议多从底层考虑问题。

全部评论
点赞 回复 分享
发布于 09-09 21:16 湖北
什么时候投的呀
点赞 回复 分享
发布于 今天 09:42 江苏
wxg压力拉满也正常了
点赞 回复 分享
发布于 昨天 22:51 安徽
都是好岗位
1 回复 分享
发布于 昨天 22:50 江苏

相关推荐

JamesGosli...:bur,佬,这么快就打牌了吗
点赞 评论 收藏
分享
评论
3
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务