首页 / hadoop
#

hadoop

#
5625次浏览 33人互动
此刻你想和大家分享什么
热门 最新
10-28 20:32
已编辑
卡内基·梅隆大学 全栈开发
国内科技公司数据基础设施需求热度榜单
MySQL: 国民级关系型数据库,是Web应用和大多数互联网公司的默认选择,普及度极高。Redis: 缓存领域的绝对王者,是网站/App高并发访问的必备神器,普及度100%。Spark: 一个非常快的分布式计算引擎,大数据领域的绝对核心,是数据处理任务的标配,普及度和认可度无可撼动。Hive: 它让你可以用写SQL的方式去分析存在HDFS上的海量数据。大数据领域曾经的绝对核心和入门必备。Hadoop: 大数据技术的基石(HDFS:存,MapReduce:算),普及度100%,是入门大数据的起点。Flink: 实时计算的标杆,与Spark构成批流一体两大巨头,在国内大型互联网公司中应用非常广泛。Kafka: 高吞吐消息队列。事实上的标准,是数据管道、微服务通信的绝对核心。ES: 搜索和日志分析领域的标配,普及度极高。Oracle: 又大又贵又稳,银行、政府、大国企的“标配”。HBase: 一个巨大的NoSQL仓库。互联网公司用于存储日志、用户行为等海量数据,普及度很高。ClickHouse: 近年来极度火爆,是实时数据分析领域的明星,各大公司都在用,社区非常活跃。Doris: 源自百度的全能型分析仓库。既能高并发查询,也能做实时分析,在很多公司逐步替代其他复杂方案。HDFS: HDFS是分布式文件存储系统,一个由无数台机器硬盘组成的专门用来存海量文件的大存储系统。RabbitMQ: 传统消息队列的首选,但在超高吞吐量的数据流场景不如Kafka。ZooKeeper: 分布式系统的基石,虽然近年来有etcd等挑战者,但其在Hadoop生态中的核心地位暂时无法撼动。Presto: 可以让你用一条SQL语句同时查询MySQL、Hive、Kafka等多个数据源,快速拿到结果。几乎所有大数据平台都会部署。SQL Server: 微软全家桶专用数据库。Iceberg: 主流数据湖表格式技术之一,由Netflix开源。Hudi: 主流数据湖表格式技术之一,由Uber开源。Cassandra: 高可用的分布式仓库,更强调“无单点故障”,在任何地方都能读写。在国内不如HBase普及。
点赞 评论 收藏
分享
08-20 13:13
已编辑
字节跳动_火山引擎_研发
字节26届校招内推~ Leader直招
🏢公司名称:字节跳动💻招聘岗位:团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。1、打造业界PB级OLAP引擎,支撑字节跳动主要产品线(如抖音、今日头条)的ETL、湖仓分析场景等;2、参与以Spark、Doris、Presto、Ray、Lance等为代表的大数据引擎内核优化;3、打造基于高并发大流量业务场景的大数据查询服务、任务调度系统、异构数据湖统一元数据服务及权限管理服务的设计和研发;4、参与字节跳动数据引擎的架构设计、业务场景支持、性能优化与降本、稳定性提升。职位要求:1、2026届获得本科及以上学历,计算机相关专业优先;2、熟练掌握Java或C++编程,具备扎实的计算机基础知识(包含数据结构、算法、多线程编程、I/O、操作系统等);3、熟悉Spark、Doris、StarRocks、Presto、Kylin、Hive、Impala、Flink、ClickHouse、Ray、Lance、Paimon、Iceberg、Hudi等主流大数据系统原理及源码优先;4、熟悉主流的OLAP引擎的优化原理,如CBO、向量化执行、物化视图、列式存储、Shuffle优化等。业务发展迅速,海量部门校招hc,福利待遇国内顶级,欢迎大家私信投递简历,超快回复
投递字节跳动等公司10个岗位
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客网在线编程
牛客网题解
牛客企业服务