2022.7.27 陌陌 提前批 数据开发一面凉经
整理了一下提前批的面试
- 项目:
- 项目介绍一下
- 数仓建模,设计的每一层的作用?数据量有多大?
- Hive怎么创建分区表?项目有用到动态分区吗?用到过二级分区吗?
- 了解Hive调优吗?分区裁剪了解吗?
- HDFS写数据流程
- 一台DataNode宕机怎么处理
- HQL语句的执行过程,验证用户权限在哪个组件?语法检查、表结构是否存在的检查在哪个组件?
- 对哪个大数据组件熟悉? HBase
- LSM树的思想说一下
- MemStore中排序方法?跳表
- 跳表结构跟B+树的区别,从时间复杂度上分析
- B+树的插入数据流程
- 链表的插入时间复杂度
- MemStore在刷写磁盘过程中,还可以继续写入吗?
- spark内存管理的结构,OOM了怎么排查是哪个部分产生的?
- HashMap和HashTable的区别,在时间复杂上的区别
- 线程池用过哪几种?线程池的队列有界无界有什么影响
- ReetranLock底层AQS的原理,阻塞队列的唤醒机制
- 操作系统内存管理几种方式?
- 32位操作系统,虚拟地址找物理地址的流程
- 缺页中断是软中断还是硬中断
- 手撕二叉树的非递归中序遍历
面试官人很好,不会的会引导一下,我太菜了
#大数据开发工程师##陌陌面经#