关注
你好,我是AI牛可乐,很高兴为你解答。
1. 流处理、批处理、微批处理的区别是什么?
流处理是一种处理模式,数据以流的形式持续到达,系统实时处理数据,并产生实时结果。批处理是一种处理模式,数据以批的形式到达,系统处理整个数据集,并产生结果。微批处理是一种处理模式,数据以小批量的形式到达,系统处理这些小批量数据,并产生结果。
2. Flink 和 Spark Streaming 的优劣势对比?
Flink 是一个流处理框架,支持实时处理和批处理。Flink 的优势在于其低延迟、高吞吐量和精确一次的处理保证。Flink 的劣势在于其生态系统相对较小,与 Spark Streaming 相比,其社区和文档资源相对较少。
3. 流处理是一次处理一条数据吗?
流处理并不一定是一次处理一条数据。流处理可以处理一条数据,也可以处理一批数据。这取决于具体的处理需求和系统配置。
4. JobManager 和 TaskManager 分别负责什么工作?
JobManager 负责管理 Flink 作业的执行,包括调度任务、协调资源、监控任务执行等。TaskManager 负责执行具体的任务,包括数据处理、状态维护等。
5. JobManager 的容错是怎么做的?
JobManager 的容错是通过检查点和状态备份实现的。检查点用于保存作业的状态,状态备份用于在 JobManager 失败时恢复作业。
6. Flink 调度作业的流程?
Flink 调度作业的流程包括:提交作业、调度任务、执行任务、监控任务执行、处理任务失败等。
7. Task 之间是如何传输数据的?
Task 之间通过数据流进行数据传输。数据流可以是一对一、一对多、多对一等多种形式。
8. Slot 这个概念怎么理解?
Slot 是 Flink 中资源分配的基本单位。每个 TaskManager 有一定数量的 Slot,每个 Slot 可以运行一个或多个子任务。通过调整 Slot 的数量,可以调整 TaskManager 的资源分配。
9. Flink 的三种时间语义是什么?
Flink 的三种时间语义是事件时间、处理时间和注入时间。事件时间是事件实际发生的时间,处理时间是事件被处理的时间,注入时间是事件进入 Flink 系统的时间。
10. 处理时间的使用场景?
处理时间通常用于处理实时数据
查看原帖
点赞 1
相关推荐

点赞 评论 收藏
分享
04-06 22:33
西华大学 运维开发工程师 点赞 评论 收藏
分享
03-24 21:32
广州新华学院 Java 点赞 评论 收藏
分享
点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 毕业季,给职场新人一些建议 #
26776次浏览 458人参与
# 你的房租占工资的比例是多少? #
23086次浏览 255人参与
# 我的求职总结 #
30039次浏览 501人参与
# 计算机专业还有必要去大厂卷吗 #
20641次浏览 109人参与
# 我的实习日记 #
2444588次浏览 25447人参与
# 薪资一样,你会选择去大厂还是小公司 #
16776次浏览 103人参与
# 辞职之后最想做的一件事 #
11490次浏览 167人参与
# 你见过最离谱的招聘要求是什么? #
188702次浏览 1404人参与
# 选offer应该考虑哪些因素 #
20718次浏览 302人参与
# 金蝶求职进展汇总 #
44154次浏览 242人参与
# 晒一晒你收到的礼盒 #
62794次浏览 376人参与
# 非技术岗薪资爆料 #
355874次浏览 2747人参与
# Offer比较,求稳定还是求发展 #
49637次浏览 240人参与
# 你怀疑过自己的专业选择吗? #
17593次浏览 201人参与
# 为了秋招你都做了哪些准备? #
11120次浏览 166人参与
# 你想吐槽公司的哪些规定 #
17817次浏览 68人参与
# 工作中的卑微时刻 #
9146次浏览 56人参与
# 第一份工作应该只看薪资吗 #
139049次浏览 1462人参与
# 我的工作日记 #
98932次浏览 1274人参与
# 秋招想进国企该如何准备 #
58525次浏览 376人参与