字节DATA数据平台三面1105
总共50分钟
10分钟自身情况
1.自我介绍
2.实习项目技术栈最大难题
3.实习项目解决的业务痛点
30分钟情景题
Q.消息队列,数据量很大,实时性强,给定数据是三元组(from_uid, to_uid, video_id),表示抖音视频的转发过程,from用户转发给to用户一个为a的视频,然后求每个视频转发的最大深度,输出二元组(video_id, max_depth)
from_uid to_uid video_id
1 2 a
2 3 a
……
我公式写个dfs,他说怎么处理实时性
我公式搞个时间窗口,每一小时进行一次计算,他说消息递归太多会爆
我说存储上一次计算的结果,用空间换时间,他说万一树的最大深度不在上一次的最大深度情况呢
我改写个bfs应该就能解决上述问题,他说可行但是不够贴近业务,怎么解决分布式问题
我说用flink的消息队列+bfs,他说还是不够贴近
我没招了
10分钟反问
反问业务、前景、landing