多益网络一面
大数据开发(研发)岗(面试官很好是我太菜)
1.问实习(学到了什么之类的)
2.介绍项目
3.项目中用的Hive,问我用的外部表还是内部(包是外部的,问就是外部安全)
4.最熟悉哪个java集合(HashMap)(这个问题别人的面经也有准备准备吧我看了但是没记住)
5.应用场景是啥
6.它线程安全不
7.String name="xxx"创建了几个对象存储在哪
8.mysql主键和唯一索引有啥区别
9.内连接是干啥的(交集)
10.集群是自己搭建的不(包的老弟包的)
11.hive的元数据搁哪放(metastore)
12.Hadoop用的哪个版本啊(我说的是3x)
13.问我HDFS,介绍一下我说的架构(active NN,standbyNN,DN)
14.因为我说Active nn和standby nn了问我是默认就有的不(不到啊不记得了)
15.HDFS写流程
16.if有个dn挂了怎么办!当然是再找一个替代他喽(先暂停找个备胎替代然后接着干)
17.Spark常用算子
18.哪些是转换哪些是行动
19.场景题 hive去重+找最大的100个数
求offer