首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
鱼街
华南农业大学 数据仓库
关注
已关注
取消关注
顶
@最不牛的牛客:
数仓方向实习或求职需要准备什么?(小白向)
前情提要:本文主要面向想在数仓方向求职的牛油,仅是我的个人理解和想法,欢迎提出建议和修改意见 近期有周围同学和个别牛友有问我:“数据仓库岗位需要准备什么才能找到实习或工作”,我在牛客上没有找到面向小白的比较清晰的解答,所以试着回忆一下我的去年春招(实习)和今年秋招我做的准备,并试着做一点总结,看能不能解决大家的部分疑惑。 首先,实习和秋招都面过多个互联网大厂,发现实习和正式的难度差距不是很大的。不要抱着“我随便学学就能找到实习”或“实习应该不需要会许多技术栈吧,我大概了解一下大数据组件就好”的想法。我大概觉得实习是秋招的70%难度(感觉日常实习跟暑期实习难度差不太多),都是需要手撕算法和背八股的,实习需要至少提前2个月准备比较稳妥,而秋招/春招则需要更多的时间,相关方向实习是求职最好的敲门砖。实习和求职所需准备(每一项我会列举几个面试常问的问题,可以对比一下自己的情况)1、编程语言 由于很多大数据组件都是由Java编写,所以Java是必须要学会的,而且要较为深入。这里的深入并不是指工程能力,而是要把Java SE学明白,这里就有很多八股需要背。sql也需要非常熟练,不过这部分基本都是使用,八股不多。Scala和Python我觉得是锦上添花,可学可不学。八股例:Java的GC有哪些,有什么特点?Java多线程和线程池?hashmap的底层实现?列表扩容机制?sql执行流程?2、算法能力 这个没得说,最简单的办法就是刷lc或牛客,至少要刷完面试高频的题,很多面试都有手撕算法,在会写的同时也要有一定的理解,不熟练的话面试紧张很容易写不出来。在数仓方向与后端不同,也需要对sql熟练,面试基本上都会手撕sql,个人理解sql比算法要简单不少,但也需要一定的积累。偶尔也会遇到一点非算法的手撕,比如写个饿汉单例,或写个分词计数(MapReduce或Spark)。3、大数据组件 hadoop系列要背一些面经的,hdfs、MapReduce、yarn、hive、zookeeper等,这里有不少面经需要背,也是最能体现你熟悉大数据领域的地方。其次离线数仓要学好spark,实时数仓要学spark stream和flink。其他的像MySQL(很重要)、redis、Kafka(mq)、clickhouse等等也是体现你能力的地方,体现你的专业。八股例:mr中shuffle的具体流程?三次排序?分别是什么排序?spark的宽窄依赖?如何划分stage?比mr优势在哪?hdfs的容灾策略?读写流程?fsimage和editlog?MySQL版本链?为什么使用B+树?数据倾斜?怎么解决?怎么设计表redis雪崩?4、数仓模型 这是一个非常重要的部分,以至于我单独拿出来。因为这是考察面试者到底懂不懂数仓最直接的问题。至少学好阿里的one data数仓模型,至少要懂每层是在干什么,为什么要这么设计。八股例:讲一下数仓模型?为什么这么分层?维度是什么?维度建模是什么?数仓建模的流程步骤?给你一个场景,你会怎么设计?星型、雪花、星座模型?5、相关项目 需要做至少一个数仓的项目,b站上很多,找一个至少看明白,写在简历上(面试官问一些刁钻问题的时候能清晰回答不露馅)。项目是必须要有的,即使你的项目在面试官看来像个玩具,但如果连相关项目都没有,面试官也没有办法(许多公司面试时都明确要求要问项目)。6、计算机基础 很多同学注重语言和大数据组件的学习,忘记了计网、操作系统等这些才是学生最该熟练掌握的,这是体现个人知识扎实程度的部分,非常关键。这里也会有一些八股需要背,对于科班同学来说,学好课上的知识就基本OK,但对非科班的同学来说就稍微麻烦一些,需要花些时间。八股例:TCP与udp?三招四挥?http与https?七层模型?页?线程与进程?7、面试技巧 略(网上太多了)但一定注意不要问不该问的,一定不要过于谦卑,要自信但不要自傲。如果你能跟面试官聊一些他都感兴趣的东西,那就基本上成功了!总结 如果上面的一些八股你都差不多能答上来,那很有机会找个不错的实习,我找实习的时候也就差不多这样(不过今年不知道会不会更卷,不敢打包票[尴尬]) 如果是实习,可以根据情况少学一些,但也要至少对Java,mr,hdfs等有较为深刻的认识,算法sql也要过关。 求职则可以根据想投的职位jd,深入学习一下,我认为知识深度大于广度,与其去把所有OLAP都涉猎一点,不如深入钻研一下某组件,让面试官眼前一亮。
点赞 37
评论 8
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
昨天 19:56
字节跳动_TT图文_研发(实习员工)
再战27暑期实习!!懂车帝Agent架构一面
自我介绍实习经历介绍(这里就不详细展开,因为每个人不同,下面会记录一些闻到的通用的场景题)做一个开放平台需要有哪些模块开放平台的鉴权如何做,有没有了解过OAuth2开放平台的网关能做一些什么事情KV数据库的选型怎么考虑如何设计一个秒杀系统热点行更新是具体怎么做的对 AI 了解到什么程度为什么想要做Agent相关的工作飞书的MCP工具是如何写的你的AI coding的经验有哪些(因为给面试官说AI代码覆盖率到90%+,所以问了很多)如果做一个通用Memory的功能未来如何打算无算法题
查看12道真题和解析
点赞
评论
收藏
分享
01-12 11:56
门头沟学院 Java
家人们谁懂啊 boss打个招呼被骂了
我这个招呼话术用了好几年了,就是个美好的祝福,一般收到的回复都是"下班就去买彩票“”这个招呼真特殊“”这个真得接""真中了分你一半“”谢谢你,也祝你暴富“这样理解的还是第一次见,真是没招了啊家人们招聘
AsusCoding:
扯到中彩票确是突兀了
,感觉有些诈骗短信就这么发的
点赞
评论
收藏
分享
02-23 22:58
南京师范大学泰州学院 golang
26届学院本 这样的简历春招能拿到offer嘛
###
你的简历改到第几版了
点赞
评论
收藏
分享
昨天 16:02
OPPO_AI算法部_AI研究员(准入职员工)
OPPO内推,OPPO内推码
OPPO二面面经 C/C++开发请详细介绍您简历中提到的基于单片机的开发项目。请详细介绍您简历中提到的嵌入式Linux系统开发项目。(注:根据描述,这两个项目是面试重点)您在Linux系统下开发过哪些类型的设备驱动?请简述您对Linux I/O多路复用机制 epoll 的理解。您提到了LCD驱动和Input子系统,能否更具体地谈谈您在这方面的实践经验?在Linux设备驱动开发中,中断处理函数的编写需要遵循哪些要点和规范?您是否了解 key_report 这类事件上报机制在底层(如Input子系统)是如何实现的?(驱动开发) 请概述开发一个字符设备驱动程序的主要步骤和框架。(驱动开发) 如果要为...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
你们开工红包发了多少?评论抽2人送外卖券
3335
2
...
总结下秋招被问到的关于AI的面试题
2675
3
...
没有不拿offer的义务!
1886
4
...
双非大厂实习
1667
5
...
字节后端Agent一面凉经
1254
6
...
开水加点🍬
968
7
...
没想到我因为一件“小事”彻底破防了
908
8
...
相求问下我的简历该怎么优化?很多hr拿到简历之后就不回复了很难受
820
9
...
大三异地的实习有必要去吗
808
10
...
实在智能Java二面面经 (仍需沉淀)
800
创作者周榜
更多
正在热议
更多
#
开工第一帖
#
13071次浏览
274人参与
#
携程求职进展汇总
#
882682次浏览
5796人参与
#
xx岗简历求拷打
#
4163次浏览
48人参与
#
工作不开心辞职是唯一出路吗
#
8080次浏览
30人参与
#
有转正机会的小厂实习值得去吗?
#
6038次浏览
73人参与
#
掌握什么AI技能,会为你的求职大大加分
#
4429次浏览
201人参与
#
实习期间如何提升留用概率?
#
241492次浏览
1824人参与
#
为什么国企只招应届生
#
238774次浏览
1301人参与
#
参加完秋招的机械人,还参加春招吗?
#
111111次浏览
709人参与
#
哪些公司开春招了?
#
32834次浏览
204人参与
#
秋招你经历过哪些无语的事
#
101364次浏览
597人参与
#
金三银四,你有感觉到吗
#
691734次浏览
6088人参与
#
毕业季等于分手季吗
#
54905次浏览
654人参与
#
牛客租房专区
#
160263次浏览
1924人参与
#
联想求职进展汇总
#
335074次浏览
2220人参与
#
牛友投递互助,不漏校招机会
#
439129次浏览
5243人参与
#
正在春招的你,也参与了去年秋招吗?
#
353088次浏览
2597人参与
#
你最讨厌面试被问什么
#
6280次浏览
81人参与
#
非技术er求职现状
#
139168次浏览
821人参与
#
你觉得今年春招回暖了吗
#
931329次浏览
7233人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务