蔚来一面面经,数据开发岗

自我介绍

1.spark和flink有哪些共性和区别

2.你说到flink是一条数据一条数据的处理,那我们要对以前数据做聚合会怎么处理(状态机制)

3.状态怎么进行恢复和使用(checkpoint机制,下游二阶段提交)

4.为什么会有二阶段提交

5.了解过二阶段提交机制怎么实现吗

6.两阶段提交是保证卡夫卡提交和checkpoint机制同时完成,怎么去保证这个事情,状态保存在哪里

7.flink针对kafka是怎么去传递两阶段结果的

8.对spark有哪些自己的理解

9.spark为什么能处理大规模数据集(高并发)

10.多台机器处理,内存是比较宝贵的,数据过大,内存放不下怎么处理(写盘)

11.spark当中结点分为那些类型

12.大规模数据集,不断落盘,是写到同一个磁盘文件还是多个磁盘文件

13.spark中间会一直生成小文件,如何处理

14.什么是OOM,什么时候会出现OOM

15.怎么去定位OOM出现在哪

16. jvm, 内存模型

17.spark SQL怎么执行(任务调度)

18.底层资源调度是什么资源

19.程序运行,内存放的什么东西,怎么管理内存,内存分配

20. MySQL执行引擎

21.什么是聚簇索引

22.为什么要回表,什么样的操作会回表

23.介绍什么是b+树

24.知道平衡二叉树吗,什么是二叉树

25.精准一次语义,kafka中有那些语义

26.java这一块熟悉哪些内容,对java这块实现数据结构了解那些

27.hashmap底层怎么实现,怎么去实现不可重复的,如果重复了怎么处理。hashcode和equals方法有什么区别和联系,如何判断是否和现有的key相同

28.线程安全问题,什么是线程安全

29.主要课程包括哪些

30.大模型这块,transform架构了解过吗,用来做什么

31.SQL题,求班级TOP5学生信息

32.SQL锁机制,多个用户同时去写一条数据

33.锁机制和事物区别

34.什么是悲观锁什么是乐观锁

35.乐观锁怎么实现

36.进程和线程有什么区别,怎么去调度线程/进程运行,了解过协程吗

37.一个进程中包含哪些部分,哪些数据

38.讲一下堆和栈,栈有哪些应用

全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务