26秋招快手数据开发面经
1.介绍一下项目以及项目中用到的一些大数据组件
2.HDFS的文件存储格式有哪些?
3.MapReduce过程,MapTask和ReduceTask个数怎么确定?
4.MapReduce阶段哪些因素会影响性能?
5.Flink和Spark Streaming的区别是什么?
6.Kafka的消息传递机制是怎样的?
7.大数据处理中的一致性、可靠性、可用性如何权衡?
8.数据仓库和数据湖的区别是什么?
9.Hive和传统数据库的区别?
10.Spark如何进行数据倾斜的优化?
2.HDFS的文件存储格式有哪些?
3.MapReduce过程,MapTask和ReduceTask个数怎么确定?
4.MapReduce阶段哪些因素会影响性能?
5.Flink和Spark Streaming的区别是什么?
6.Kafka的消息传递机制是怎样的?
7.大数据处理中的一致性、可靠性、可用性如何权衡?
8.数据仓库和数据湖的区别是什么?
9.Hive和传统数据库的区别?
10.Spark如何进行数据倾斜的优化?
全部评论
相关推荐
今天 11:35
西安电子科技大学 后端工程师 孟鹿君:无所diao胃,面试官没看出来说明他也是个草包,世界就是个草台班子,只是他们前几年运气好找到了工作,放现在他们也只能跟我们一样海投
点赞 评论 收藏
分享
查看17道真题和解析 点赞 评论 收藏
分享
文远知行公司福利 498人发布