转转数仓

10.25感谢信
------------------------------------------------------------------------
10.16一面

1.讲一下自己的项目和实习经历
2.对数据仓库分层了解吗?每一层的作用
3.那这个项目最后做出了些什么效果呢?
4.String中直接赋值和new一个新的对象的区别?
5.JVM中的堆有哪些区域?
6.了解垃圾回收算法吗?收集器呢?
7.CMS和G1的区别?
8.什么时候索引会失效?
9.hadoop中的hdfs有namenode、datanode、secondarynamenode,secondarynamenode的作用?
10.讲一下yarn的提交流程
11.hive中group by这些语句会导致数据倾斜,有什么调优吗?
12.大数据组件是怎么学习的?
13.最近还有学习什么新组件吗?
反问:数仓岗位主要做什么事情?

10.17二面
1.对数仓分层的了解?
2.了解过哪些OLAP组件?
3.对数据治理这方面了解吗?
4.你觉得要如何判断一个数据仓库是否建立的好?
5.数据仓库建模有什么形式?
6.维度建模的过程?
7.了解过拉链表吗?
8.有没有了解过如果要在mysql中实时的将数据增量到hdfs中要怎么做?
9.hive的执行流程是怎么样的?
10.hive有什么join呢?
11.join语法的话有什么需要注意的点呢?
12.了解过left semi join吗?
13.在join的时候什么时候会有一些笛卡尔积的问题?
14.在使用join的时候有没有遇到一些问题?如何去解决?
15.hive的存储格式有哪些?有什么区别?
16.hive的行转列,列转行有哪些?
17.hive的炸裂函数用过吗?
18.写过udf,udtf吗?
19.hive什么语句会锁表
20.hadoop的shuffle阶段有几次排序?
21.hadoop的namenode的高可用如何保证?resourcemanager的呢?
22.hadoop的namenode的高可用里的共享信息这块是用什么架构?
23.nodemanager通常会向resourcemanager传递他的心跳信息,是通过什么协议来传输的?
24.小文件通常有什么处理方式?如果你来对小文件的处理你会怎么做?
25.mysql中的索引有什么类型?
26.mysql建立所以需要注意的点有哪些?
27.mysql中索引失效有什么情况?
28.了解不同数据类型的字段做索引的话在过滤条件里不走索引的原理吗?

算法:1.有八个球,其中有一个球比较轻,需要几次操作可以将它判断出来?
2.对于一个不排序的数组,要取出俩个数值为10的数,有什么方法?最优的时间复杂度方法有哪些?

10.19 hr面
1.本科的专业是自己选的吗?基于什么原因选的?
2.实际学了之后感觉怎么样?
3.大三大四期间有没有考虑读研?
4.实习是什么样的场合去选择的?没有转正机会吗?
5.当时主要负责的项目是什么呢?
6.个人的实习收获是什么呢?
7.实习中遇到最大的困难和挑战是什么?是怎么解决的?
8.对自己的职业规划的话是怎么样的?
9.数仓的具体工作哪些吸引到你?
10.你觉得你是个什么样的性格的人?别人对你的评价是怎么样?
11.大学期间做过自己觉得最骄傲最自豪的事情是什么?
12.有兄弟姐妹吗?
13.爸妈是从事什么职位的?
14.父母对你从小的教育理念和教育方法是怎样的?
15.小学初中高中在学业上是怎么样的管理方式?是会给你制定目标还是帮你做还是让你自己做?
16.父母对你是属于放养还是会说为你做些规划呢?
17.成长过程中对你影响最大的人是?有什么影响
18.从小到大对你最热爱的是什么事情?
19.你去找一个公司会最看重公司的什么呢?
20.从什么渠道了解到转转?
21.除了转转之外还接触了什么公司?
反问:前两轮面试官的评价?公司的薪资架构?面试结果什么时候出?

许愿转转oc,面试流程和面试感受真的是最佳的一家,希望能给个机会吧!

#面试题目##转转#
全部评论
同数仓,咋跟我之前面的问题几乎一样😅,我是9月中面的
点赞 回复 分享
发布于 2021-10-20 17:14

相关推荐

作业帮时间是随机的,今天下午测的。作业帮是10道选择题加2到算法题:选择题:考了数据结构排序二叉树,linux命令:awk '$NF' test 这里的test是一个有多行数据的文件,这命令是输出该文件末行的内容。还考了mapreduce优化数据倾斜的办法这里我好像选错了有两个选项一个是把count(distinct ) 替换为sum()group by 还有是将小文件先保存到内存中这两个好像是对的都可以优化数据倾斜此问题。还考了Flink的一些特性不过我还没学过flink,还考了kafka的高性能和低性能的一些问题,这我也是一脸懵。还考了六个盘的汉洛塔要移动几次才通过。然后是算法题,第一个是简单的二分查找,不过我只通过了94%,后面看估计是我对左右指针移动还是有点问题。第二个是leetcode32题,最长有效括号,可惜了我两个月前还写过但是还是没写对,只通过了63%。也不知道能不能过。阅文(寄了,以为是8.30考没想到是8.30结束结果只写了20分钟):这好像是前面是单选题,中间是不定项,后面是问答题单选题:考了hive内置函数,考了hive与spark的对比,hadoop节点默认备份是多少~(还考了斗破苍穹的主角是谁虽然我没看过印像中好像叫萧炎)不定项:有mysql中delete,drop和truncate这三者的区别特点(我对truncate完全没印象),还考了flink的一些知识。问答题:第一个是mapredce工作流程这个还好,第二个是如何解决spark数据倾斜的方法。这里时间不够了我一点没写,也没多少印象。这里我现在写一下加深点印象1.可以增加随机前缀或后缀:来打散数据分布,在后继计算中去除前后缀从而负载均衡2.广播小表,如果是原因是小表与大表join可以将小表广播到每个节点,避免产生数据倾斜。3.salting方法:为倾斜数据填加盐值,打散倾斜数据4.分区策略调整:通过自定义分区器或者合理选择内置分区器来均匀分布数据5.增大并行度:针对只有少量数据造成的倾斜任务,增加并行度可以更快地处理这些小任务6.数据预处理:合并一些小文件,fliter操作等第三四个就是写sql语句,第三个挺简单的就是第四题来不及看了。ok就是这些了,预祝大家都能找到自己想要的工作实现,我还是继续去沉淀去了,这一个月也不知道自己在忙些啥好像就是一直在刷算法题和sql题,八股都没怎么看,对组件的掌握还是太浅了。
查看14道真题和解析 投递阅文集团等公司6个岗位 数据人的面试交流地
点赞 评论 收藏
分享
评论
4
25
分享

创作者周榜

更多
牛客网
牛客企业服务