26秋招快手数据开发面经
1.介绍一下项目以及项目中用到的一些大数据组件
2.HDFS的文件存储格式有哪些?
3.MapReduce过程,MapTask和ReduceTask个数怎么确定?
4.MapReduce阶段哪些因素会影响性能?
5.Flink和Spark Streaming的区别是什么?
6.Kafka的消息传递机制是怎样的?
7.大数据处理中的一致性、可靠性、可用性如何权衡?
8.数据仓库和数据湖的区别是什么?
9.Hive和传统数据库的区别?
10.Spark如何进行数据倾斜的优化?
2.HDFS的文件存储格式有哪些?
3.MapReduce过程,MapTask和ReduceTask个数怎么确定?
4.MapReduce阶段哪些因素会影响性能?
5.Flink和Spark Streaming的区别是什么?
6.Kafka的消息传递机制是怎样的?
7.大数据处理中的一致性、可靠性、可用性如何权衡?
8.数据仓库和数据湖的区别是什么?
9.Hive和传统数据库的区别?
10.Spark如何进行数据倾斜的优化?
全部评论
接好运
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
2025-12-16 17:17
门头沟学院 产品经理 点赞 评论 收藏
分享
2025-11-20 15:33
门头沟学院 Java 点赞 评论 收藏
分享
点赞 评论 收藏
分享

