匿名牛油

昨天 15:48

不愿透露姓名的神秘牛友

蔚来一面面经，数据开发岗

自我介绍

1.spark和flink有哪些共性和区别

2.你说到flink是一条数据一条数据的处理，那我们要对以前数据做聚合会怎么处理(状态机制)

3.状态怎么进行恢复和使用(checkpoint机制，下游二阶段提交)

4.为什么会有二阶段提交

5.了解过二阶段提交机制怎么实现吗

6.两阶段提交是保证卡夫卡提交和checkpoint机制同时完成，怎么去保证这个事情，状态保存在哪里

7.flink针对kafka是怎么去传递两阶段结果的

8.对spark有哪些自己的理解

9.spark为什么能处理大规模数据集(高并发)

10.多台机器处理，内存是比较宝贵的，数据过大，内存放不下怎么处理(写盘)

11.spark当中结点分为那些类型

12.大规模数据集，不断落盘，是写到同一个磁盘文件还是多个磁盘文件

13.spark中间会一直生成小文件，如何处理

14.什么是OOM，什么时候会出现OOM

15.怎么去定位OOM出现在哪

16. jvm, 内存模型

17.spark SQL怎么执行(任务调度)

18.底层资源调度是什么资源

19.程序运行，内存放的什么东西，怎么管理内存，内存分配

20. MySQL执行引擎

21.什么是聚簇索引

22.为什么要回表，什么样的操作会回表

23.介绍什么是b+树

24.知道平衡二叉树吗，什么是二叉树

25.精准一次语义，kafka中有那些语义

26.java这一块熟悉哪些内容，对java这块实现数据结构了解那些

27.hashmap底层怎么实现，怎么去实现不可重复的，如果重复了怎么处理。hashcode和equals方法有什么区别和联系，如何判断是否和现有的key相同

28.线程安全问题，什么是线程安全

29.主要课程包括哪些

30.大模型这块，transform架构了解过吗，用来做什么

31.SQL题，求班级TOP5学生信息

32.SQL锁机制，多个用户同时去写一条数据

33.锁机制和事物区别

34.什么是悲观锁什么是乐观锁

35.乐观锁怎么实现

36.进程和线程有什么区别，怎么去调度线程/进程运行，了解过协程吗

37.一个进程中包含哪些部分，哪些数据

38.讲一下堆和栈，栈有哪些应用

全部评论

推荐最新楼层

09-17 22:10

西安邮电大学 Java

本座帮你把烦恼斩立决！

每一次面试的时候其实都很紧张，但是总有一些面试官相对良善吧，就比如我的腾讯会议头像是丛雨（其实没指望人认识），但是之前面过的一个公司，面试官头像是琪露诺我当时直接绷不住了。。。还特地拍了个照留念一下。。。紧张情绪在那一刻其实就消散了不少

牛友故事会

点赞评论收藏

昨天 19:39

门头沟学院数据分析师

滴滴数据分析，面经分享

滴滴-CTO线-数分面经-偏风控1. 手撕SQL 一张表上有司机id 乘客id 订单id 接单时间 找到每天最早接单的十个司机；2. 深挖项目经历；3. 业务场景：关于先享后付的功能会出现坏帐的情况，出现这个问题建立一个指标体系应该如何监督并且下钻分析原因；4. 继上一个问题，对不同用户进行分层后，可以使用什么策略减少这种问题的发生；

投递滴滴等公司10个岗位

点赞评论收藏

08-29 16:11

蚌埠坦克学院 Java

被AI面试官追着鲨

面试时最害怕被问到的问题

点赞评论收藏

08-29 10:52

点赞评论收藏

09-16 11:47

门头沟学院 Java

无情的简历投递机

我是秦始皇，我是秦始皇。offer快来offer快来。七月开始投到现在应该有几十家了，中大厂都投了，目前就联想进面了，其他的都在泡池子。图中每投完一个我都会把官网加入收藏夹。现在每天两眼一睁就是投，感觉已经成为了一种晨间仪式了。看到邮件发来的测评就PTSD了，特别是心理测评，属于是一场大型人格分裂。我已经想好怎么用这些傻波一测评来写论文了，题目就叫《论如何用测评题证明自己不是反社会人格》我的offer呢我的offer呢我的offer呢海笔滚一边去海笔滚一边去感觉现在心理状态很稳定啊，稳定地不稳定

投递联想等公司10个岗位

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 不考虑薪资和职业，你最想做什么工作呢？ #