文远知行 数据开发/Data Infra 实习 一面

自我介绍

项目介绍

Spark:Stage如何切分?
原因?

倾斜原因?
如何解决?

介绍一下概率算法(HLL、CMS)

Flink vs Spark 容错机制、故障恢复机制 异同?

Flink 窗口处理迟到机制?除了Watermark呢?

Exactly-once

Ray了解吗?

算法:三个数组各取一个数得到 a, b, c
问:min(|a - b| + |b - c| + |a - c|) length < 1e6

问有排序后 ON 做法吗?

#数据开发##实习#
全部评论

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务