面试复盘|携程 大数据 一 二面

大数据底层开发
45min
1.自我介绍
2.聊了会学校里研究方向,
3.介绍下学校里做的项目,还有非简历上写的一些项目、比赛
4.spark和hive的联系
5.mr执行过程和spark rdd的理解 ,优缺点
6.hdfs读写流程(源码级别包括:读写容错机制、发送队列、确认队列、管道传输)
7.groupbykey、reducebykey区别(1、groupByKey算子的功能固定,只能输出相同key值的序列,reduceByKey适用于分组排序过程中有数据聚合操作(sum)的情形,在其他场景下可能不适用。
2、reduceByKey算子在分区内会进行数据聚合操作,因此针对有sum的数据聚合操作,效率会更高一些。(groupByKey算子也能实现类似sum的数据聚合操作,相当于进行groupByKey操作后还需进行map类算子的sum操作)
8.spring了解吗,几个特性,不太了解给面试官说了说springboot
常用什么语言啊,从这开始展开编程语言的八股文,一顿输出
9.java遇到过内存溢出吗,怎么解决的。给他扯到跑spark遇到过,driver、executor、堆内堆外内存调优
10.使用线程池有什么好处
11.有几种创建线程池的方法
12.java里怎么做线程通信的(加锁,展开介绍下sycnc lock、信号量)
13.多个线程同时访问一个加锁方法发生什么,访问非加锁方法呢,访问静态方法呢
14.currenthashmap怎么实现的(从hashmap结构开始说起)

二面
1.自我介绍
2.介绍下实习项目
3.面对特别大的数据量hive怎么去做优化处理
4.编写特别复杂的sql有没有什么好的解决方法(udf)
5.udf是怎么在hvie里执行的(打包成jar上传到集群,注册自定义函数,通过类加载器载入系统,在sql解析的过程中去调用函数)
6.有两个包名、类名相同的类能不能正确加载会出现哪些问题(编写自定义类加载器来实现)
7.基类、子类用不同层级的加载去去加载会出现什么问题(有可能出现父类没有加载出现ClassNotFOundException)
8.单例对象怎么去创建,有哪些方法。描述下代码
8.·多线程去访问怎么加锁处理
9.在上面的基础上在优化一下
10.怎么去编写一个mr程序
11.applicationmaster有什么作用
12.reduce数量怎么确定
13.描述wordcount执行过程
14.reduce怎么知道去哪里拉去map结果集
15.搭建过集群吗,你这个项目为什么要先在伪分布式环境下去做,
16.集群为什么用stanlone不用yarn管理
17用shell去统计文本里单词个数


#面试复盘##面经##携程##大数据开发工程师#
全部评论
老哥面尽大厂!
点赞 回复 分享
发布于 2021-09-15 21:29

相关推荐

Twilight_m...:表格简历有点难绷。说说个人看法: 1.个人基本情况里好多无意义信息,什么婚姻状况、健康状况、兴趣爱好、户口所在地、身份证号码、邮政编码,不知道的以为你填什么申请表呢。 2.校内实践个人认为对找工作几乎没帮助,建议换成和测开有关的项目,实在没得写留着也行。 3.工作经历完全看不出来是干什么的,起码看着和计算机没啥关系,建议加强描述,写点你在工作期间的实际产出、解决了什么问题。 4.个人简述大而空,看着像AI生成,感觉问题最大。“Python,C,C++成为我打造高效稳定服务的得力工具”、“我渴望凭借自身技术知识与创新能力,推动人工智能技术的应用发展,助力社会实现智能化转型”有种小学作文的美感。而且你确定你个人简述里写的你都会嘛?你AI这块写的什么“深入研究”,发几篇顶会的硕博生都不一定敢这么写。而且你AI这块的能力和软测也完全无关啊。个人简述建议写你对哪些技术栈、哪些语言、哪些生产工具的掌握,写的有条理些,而且最好是和测开强相关的。
点赞 评论 收藏
分享
Java大菜狗:纯纯招黑奴,一天还不到两百那么多要求,还不迟到早退,以为啥啊,给一点工资做一堆活,还以不拖欠员工工资为荣,这是什么值得骄傲的事情吗,纯纯***公司
点赞 评论 收藏
分享
评论
5
36
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务