4.27 阿里菜鸟网络数开二面面经

一如既往,电话突击面试,大概持续一个小时。
1.自我介绍
2.大数据项目
3.spark和mapreduce比较(spark有弹性,高度利用内存,简化代码,DAG写起来可以绕地球两圈,不像mapreduce一次reduce提交一次)
4.传统关系型数据库和hdfs比较(前者轻量级,侧重实时操作;后者重量级,分布式,分而治之化整为零,横向扩展性好)
5.map join实现?应用场景?两张大表怎么选?(通过广播大变量;一般用在大表join小表,可容忍小表数据冗余的场景;两张大表就分而治之,再sort merge)
6.输入网址到返回网页的过程(域名解析,tcp连接建立,数据传输,数据回传,渲染,显示)
7.sql这块如何(没有注重语法的掌握,表示日后工作用到会熟能生巧,重点学习了理论,索引原理,并发这一块儿)
8.hashmap深挖,和treemap比较,put,get,扩容,并发问题,rehash?
9.非科班吗?自学方式说一下?
10.最近读的一本计算机方面的书?(操作系统原理)
11.聊聊操作系统原理,线程,进程?操作系统内存管理(这块儿初学,招架不住,就举了白旗:您刚说是最近读的,所以我才看了一小部分,还没有深入理解)
12.你在原专业学了这么多年(本+硕),选择转行不可惜吗?
13.实习地点选择。
14.未来学习方向规划。
15.最后问一个比较尖锐的问题。你学了这么多年土木工程,最后选择转行计算机。你怎么保证你进了计算机行业以后不会又转行?(...总算圆了过去)
16.会和一面面试官交流你的情况,等通知把。

面试官前辈人还是很好的,我发言的时候很尊重,说偏了也不会打断。他很好奇我非科班转行的历程,所以这一块儿和我多交流了一下。
期待能有下一面,祝好运。

#阿里面试##阿里巴巴##实习##大数据开发工程师##面经#
全部评论
楼主,你的大数据项目是真实项目还是网上教程搭的项目呀😃😃
1 回复 分享
发布于 2020-05-05 11:42
咦,没让做个算法题吗
点赞 回复 分享
发布于 2020-05-05 12:10

相关推荐

一面(面试官很好!很有耐心!)1.spark中rdd叫弹性分布式数据集,这个弹性的含义2.小文件的危害以及怎么处理3.spark中宽依赖、窄依赖4.stage的划分5.kafka怎么保证数据不重复消费(没回答上,但说了怎么重复消费数据)6.checkpoint机制7.spark的三种join(boardcast join,sort merge join,shuffle hash join)7.四道sql(前两道很简单,第三道次日留存和七日留存,第四道连续登录问题)8.算法题:移动最少区间个数 使得剩余区间无重叠1. 输入:[1,2][2,3][4,6][1,3]2. 输出:13. 解释:移除[1,3]后,剩余区间无重叠(面试后在牛客网看见有人分享这道算法题)一面最后面试官还问我以后的计划,我说打算先实习明年春招边实习边找工作,她居然问我没想留着字节吗(我当然想!)中间有些问题没想起来,耗时1小时40分钟二面(面试官很好!问的都是和数仓相关的,结合我的实习问)1.之前工作都干了什么2.之前实习搭建数仓的结构3.了解事实表吗,了解维度表吗4.怎么和其他人对接的5.你属于风控部门,但主要是构建数仓开发,那有没有和其他数据开发人员交流过6.你只有一段实习吧,那实习前后有什么感悟吗7.为什么要选择数据开发(我说因为之前实习是干数仓的,他说不要因为之前干什么就觉得以后三十年干什么,实习还是丰富点,看看干什么)8.最后反问二面耗时50分钟,感觉面试官对我回答的第七个问题不满意,只是我明年要毕业了,得多来一份垂直的实习建议多复习spark、hive方面的八股文、概念问题,实习生主要负责离线数仓开发
点赞 评论 收藏
分享
评论
9
31
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务