大数据开发学习路线指南(本人亲测)
以下是本人在大数据方向的技术栈学习路线,另外还有诸如HBase、Kylin、实时数仓项目、数据湖项目、湖仓一体等。下面列出的是基本所必须掌握的内容。对于项目方面,建议先离线后实时开发的学习,再之后便是数据湖等项目。
另外推荐可以经常翻看《大数据之路》这本书,里面涉及到的理论和企业中的白皮书基本一样。平常也可以多翻看各个公司公开分享的技术文章,源码等。类似阿里的学习文档、美团的技术文档等,在没有实际生产经验时可以了解各个场景下技术选型、底层调优、内存调整、资源配置、数据治理等各个重要环节和内容。
1、Java:JAVA SE、JVM、JUC
(刚开始只需要看Java基础就可以了,不需要学习一些web框架,因为不管是源码二次开发,UDF开发,还是数仓都不需要用到这些框架(除了平台开发之外),像Spring这些web框架,在学习完所有的大数据框架之后,找工作之前如果还有时间,可以去学一学这些框架【加分项】)
2、Linux+Shell
3、Git、Maven(了解会用,有印象,如果需要使用能快速学习上手使用即可)
4、Hadoop(HDFS,MapReduce,Yarn)
5、Zookeeper
6、Hadoop高可用(了解即可)
7、Hive(重点,需要熟练了解原理,并且会写HQL,以及一些优化,是基础)
8、Spark(大部分公司都是写SparkSQL,并且调优,需要明白底层原理,内存结构,SparkUI等)
9、Flume
10、Kafka(时间紧张的话,可以先放一放,和Flink一起学,kafka+Flink+Spark是处理实时数据的)
11、Maxwell、DataX、Dolphinscheduler(项目中数据同步、模拟日常调度工作)
12、sgg电商数仓x.0(跟着做完这个项目,就知道什么是数仓,什么是维度模型,什么是指标等等,以及生产中一些内容)
13、Flink
14、MPP架构(类似Doris、Clickhouse)
15、实时数仓项目
16、数据治理
17、数据湖、湖仓一体
18、刷算法、刷sql、刷场景题
#大数据开发##面试##数据人的面试交流地##秋招#
另外推荐可以经常翻看《大数据之路》这本书,里面涉及到的理论和企业中的白皮书基本一样。平常也可以多翻看各个公司公开分享的技术文章,源码等。类似阿里的学习文档、美团的技术文档等,在没有实际生产经验时可以了解各个场景下技术选型、底层调优、内存调整、资源配置、数据治理等各个重要环节和内容。
1、Java:JAVA SE、JVM、JUC
(刚开始只需要看Java基础就可以了,不需要学习一些web框架,因为不管是源码二次开发,UDF开发,还是数仓都不需要用到这些框架(除了平台开发之外),像Spring这些web框架,在学习完所有的大数据框架之后,找工作之前如果还有时间,可以去学一学这些框架【加分项】)
2、Linux+Shell
3、Git、Maven(了解会用,有印象,如果需要使用能快速学习上手使用即可)
4、Hadoop(HDFS,MapReduce,Yarn)
5、Zookeeper
6、Hadoop高可用(了解即可)
7、Hive(重点,需要熟练了解原理,并且会写HQL,以及一些优化,是基础)
8、Spark(大部分公司都是写SparkSQL,并且调优,需要明白底层原理,内存结构,SparkUI等)
9、Flume
10、Kafka(时间紧张的话,可以先放一放,和Flink一起学,kafka+Flink+Spark是处理实时数据的)
11、Maxwell、DataX、Dolphinscheduler(项目中数据同步、模拟日常调度工作)
12、sgg电商数仓x.0(跟着做完这个项目,就知道什么是数仓,什么是维度模型,什么是指标等等,以及生产中一些内容)
13、Flink
14、MPP架构(类似Doris、Clickhouse)
15、实时数仓项目
16、数据治理
17、数据湖、湖仓一体
18、刷算法、刷sql、刷场景题
#大数据开发##面试##数据人的面试交流地##秋招#
全部评论
相关推荐
投票

点赞 评论 收藏
分享