大数据工程师面试 - 字节跳动 Flink 面试考点!

我是大数据欧老师,曾在互联网某大厂任大数据负责人,从业大数据领域近 10 年,全网粉丝 5000+,从很多候选人的面试和咨询中复盘了大数据工程师的面试全流程,如果你有求职大数据工程师的计划,欢迎找我聊一聊!

直接拿走去复习!!!

Flink 知识点(上)- 概念和基础

  1. 流处理、批处理、微批处理的区别是什么?
  2. Flink 和 Spark Streaming 的优劣势对比?
  3. 流处理是一次处理一条数据吗?
  4. JobManager 和 TaskManager 分别负责什么工作?
  5. JobManager 的容错是怎么做的?
  6. Flink 调度作业的流程?
  7. Task 之间是如何传输数据?
  8. Slot 这个概念怎么理解?

Flink 知识点(中)- 窗口机制和原理

  1. Flink 的三种时间语义是什么?
  2. 处理时间的使用场景?事件时间的使用场景?注入时间的使用场景?
  3. Watermark 怎么理解?
  4. Watermark 是怎么生成的?
  5. 不同场景下该如何设置 Watermark?
  6. Tumbling / Sliding / Session Window 的定义是什么?
  7. Watermark 和窗口中 AllowLateness 机制的区别是什么?
  8. Sliding Window 中 State 是如何存储的?
  9. Session Window 的使用场景?

Flink 知识点(下)- Checkpoint 和 State

  1. Checkpoint 的流程是什么?
  2. Checkpoint 和 Savepoint 的区别?
  3. Checkpoint 提供了哪些一致性语义?
  4. Checkpoint Exactly-Once 语义是怎么实现的?
  5. StateBackend 有什么类型?
  6. 如何根据业务场景选型 StateBackend?
  7. FsStateBackend 的异步原理是什么?
  8. RocksDBStateBackend 的异步原理是什么?
  9. StateBackend 的 TTL 原理?
  10. RocksDBStateBackend 的引用计数法实现文件过期?
  11. RocksDBStateBackend 增量快照的原理?
#机械人的薪资开到多少,才适合去?##牛客在线求职答疑中心##机械人晒出你的简历##牛客解忧铺##机械人的春招flag#

解决职场真实面试问题,分享同学真实成功案例,欢迎订阅关注!

全部评论
有没有答案哇
点赞 回复 分享
发布于 2024-04-08 01:12 北京
你好,我是AI牛可乐,很高兴为你解答。 1. 流处理、批处理、微批处理的区别是什么? 流处理是一种处理模式,数据以流的形式持续到达,系统实时处理数据,并产生实时结果。批处理是一种处理模式,数据以批的形式到达,系统处理整个数据集,并产生结果。微批处理是一种处理模式,数据以小批量的形式到达,系统处理这些小批量数据,并产生结果。 2. Flink 和 Spark Streaming 的优劣势对比? Flink 是一个流处理框架,支持实时处理和批处理。Flink 的优势在于其低延迟、高吞吐量和精确一次的处理保证。Flink 的劣势在于其生态系统相对较小,与 Spark Streaming 相比,其社区和文档资源相对较少。 3. 流处理是一次处理一条数据吗? 流处理并不一定是一次处理一条数据。流处理可以处理一条数据,也可以处理一批数据。这取决于具体的处理需求和系统配置。 4. JobManager 和 TaskManager 分别负责什么工作? JobManager 负责管理 Flink 作业的执行,包括调度任务、协调资源、监控任务执行等。TaskManager 负责执行具体的任务,包括数据处理、状态维护等。 5. JobManager 的容错是怎么做的? JobManager 的容错是通过检查点和状态备份实现的。检查点用于保存作业的状态,状态备份用于在 JobManager 失败时恢复作业。 6. Flink 调度作业的流程? Flink 调度作业的流程包括:提交作业、调度任务、执行任务、监控任务执行、处理任务失败等。 7. Task 之间是如何传输数据的? Task 之间通过数据流进行数据传输。数据流可以是一对一、一对多、多对一等多种形式。 8. Slot 这个概念怎么理解? Slot 是 Flink 中资源分配的基本单位。每个 TaskManager 有一定数量的 Slot,每个 Slot 可以运行一个或多个子任务。通过调整 Slot 的数量,可以调整 TaskManager 的资源分配。 9. Flink 的三种时间语义是什么? Flink 的三种时间语义是事件时间、处理时间和注入时间。事件时间是事件实际发生的时间,处理时间是事件被处理的时间,注入时间是事件进入 Flink 系统的时间。 10. 处理时间的使用场景? 处理时间通常用于处理实时数据
点赞 回复 分享
发布于 2024-02-27 09:21 AI生成

相关推荐

压力很大,面试官全程高压,问的问题不难,但是没有任何反馈,很慌张,也无算法。实习问了20分钟,一直问我你们做的有什么用,总时长一小时1.学校都有什么课程2.spring的ioc原理以及优点3.除了解耦还知道什么?4.springboot与spring区别,二者的源码看过没?Tomcat了解嘛?有没有具体看过5.spring的bean,面试官一直在重复一个思想问我懂不懂,完全没听过6.mybatis是干什么的?ibatis用过没?平常怎么写SQL?完全不写嘛?7.设计一个分布式双十一秒杀系统(前端,网关,缓存,数据库防超卖全设计)8.怎么做限流9.缓存与数据库一致性,你做异步要用户等你嘛?10.负载均衡怎么做11.多数据中心还是单数据中心,如果出现没卖完怎么做(到这完全不会了,面试官直接说换个话题吧)12.平常读书吗?13.上过哲学课嘛?14.兴趣爱好有没有15.对ai的看法16.来深圳有问题嘛?17.为什么不考研18.上大学带给了你什么?你提升在哪里,有没有具体的例子?反问:1.现在手机都有应用市场,应用宝怎么盈利?除了手机应用市场还是有人用,现在在做跨端,微软都有合作,之后会进军mac,主要做游戏,腾讯本身就是游戏大户。2.面试表现?整体评价一下会给到反馈。面完直接变HR面,今天HR面后,已经转为录用评估了,来牛客许个愿,暑期现在还没什么面试,希望能拿个offer之后再考虑要不要留在手子吧。
nunuking:三面压力这么大吗,面试的会议约了多长时间呀
面试问题记录
点赞 评论 收藏
分享
评论
点赞
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务