vivo大数据开发1面+hr面

1.为什么从原司离职?
2.简单介绍一下自己的实习经历
3.集市对应的数仓架构
4.纯数据团队和架构团队对应分工关系
5.数仓分层
6.数仓建模方式
7.怎么区分哪些数据指标适合做到维度当中
8.数仓集市开发过程
9.Spark sql提交执行流程
10.Spark调优例子
11.Spark处理小文件方法
12.Java创建线程有哪些方法
13.集合有了解吗?List和set有什么区别
14.评价一下自己性格
全部评论
暑期嘛,hr面就问了两个问题嘛?
点赞 回复 分享
发布于 04-02 16:49 上海

相关推荐

05-08 08:07
已编辑
杭州电子科技大学 Java
一面-30分钟实习实习难点技术1. new一个hashmap(6)。它的空间实际多大?如果加对象了是多少?HashMap 会将初始容量调整为大于等于指定容量的最小的 2 的幂。并发场景使用Map2. cas。底层原理3. synchronized4. 集合对象唯一,使用什么?hashset打印有序吗?set如何有序? linkedHashSet5. 索引如何建立?联合索引?联合索引的顺序与索引不一致,查询顺序在哪里优化?6. MVCC7. readview?可见性算法8. 聚集索引、二级索引9. 一般用redis做什么10. redis持久化11. rdb会阻塞主进程吗?快照会记录当前更新的数据吗?12. rdb持久化的时机13. redis主从、哨兵、集群二面-50分钟实习1. 分片上传如何设计的2. 断点续传。如何保证上传过程中分片没有被篡改3. 如何理解注解。为什么要使用?一般会在哪里使用?4. AOP拦截注解,本质通过什么方式?反射5. 如何理解反射?自己使用过吗(aop切面中通过反射获取注解的信息,从而获取到value值)6. Threadlocal怎么使用的技术1. 什么是弱引用?其他引用?为什么有这么多引用?如何应用的?2. 做过线上处理吗3. 如何找到Java进程的id?linux命令,有没有什么工具4. 什么命令可以分析cpu性能?top默认用什么排序?可以使用内存排序吗5. 实习机器配置?6. 假如一个应用,线程数量很多,导致系统运行不稳定,告警,现在有很多系统工具。现在让你去分析,为什么这个应用占用线程,目的是降低它的线程数量,你会怎么做?如何推动这个事情去落地7. 实习最大的收获8. 假如开发阶段,产品提了需求变更,你会怎么做9. rpc、dubbo有用过吗?如何理解?10. redis幂等怎么做的?有哪些问题?如果消息隔一天发送,如果是一周呢?如果不考虑redis库存呢?从技术设计考虑redis幂等有什么问题?11. redis日志12. 近期有写业务代码吗?算法:java代码实现三个线程交替打印1-10二面面试官是个巨佬,非常非常强。介绍很长时间部门业务,日活几百万,以为自己当时能过算法题没写出来,当时还没怎么练习手撕,现在看来很可惜,如果写出来了是不是就过了
点赞 评论 收藏
分享
作业帮时间是随机的,今天下午测的。作业帮是10道选择题加2到算法题:选择题:考了数据结构排序二叉树,linux命令:awk '$NF' test 这里的test是一个有多行数据的文件,这命令是输出该文件末行的内容。还考了mapreduce优化数据倾斜的办法这里我好像选错了有两个选项一个是把count(distinct ) 替换为sum()group by 还有是将小文件先保存到内存中这两个好像是对的都可以优化数据倾斜此问题。还考了Flink的一些特性不过我还没学过flink,还考了kafka的高性能和低性能的一些问题,这我也是一脸懵。还考了六个盘的汉洛塔要移动几次才通过。然后是算法题,第一个是简单的二分查找,不过我只通过了94%,后面看估计是我对左右指针移动还是有点问题。第二个是leetcode32题,最长有效括号,可惜了我两个月前还写过但是还是没写对,只通过了63%。也不知道能不能过。阅文(寄了,以为是8.30考没想到是8.30结束结果只写了20分钟):这好像是前面是单选题,中间是不定项,后面是问答题单选题:考了hive内置函数,考了hive与spark的对比,hadoop节点默认备份是多少~(还考了斗破苍穹的主角是谁虽然我没看过印像中好像叫萧炎)不定项:有mysql中delete,drop和truncate这三者的区别特点(我对truncate完全没印象),还考了flink的一些知识。问答题:第一个是mapredce工作流程这个还好,第二个是如何解决spark数据倾斜的方法。这里时间不够了我一点没写,也没多少印象。这里我现在写一下加深点印象1.可以增加随机前缀或后缀:来打散数据分布,在后继计算中去除前后缀从而负载均衡2.广播小表,如果是原因是小表与大表join可以将小表广播到每个节点,避免产生数据倾斜。3.salting方法:为倾斜数据填加盐值,打散倾斜数据4.分区策略调整:通过自定义分区器或者合理选择内置分区器来均匀分布数据5.增大并行度:针对只有少量数据造成的倾斜任务,增加并行度可以更快地处理这些小任务6.数据预处理:合并一些小文件,fliter操作等第三四个就是写sql语句,第三个挺简单的就是第四题来不及看了。ok就是这些了,预祝大家都能找到自己想要的工作实现,我还是继续去沉淀去了,这一个月也不知道自己在忙些啥好像就是一直在刷算法题和sql题,八股都没怎么看,对组件的掌握还是太浅了。
查看14道真题和解析 投递阅文集团等公司6个岗位 数据人的面试交流地
点赞 评论 收藏
分享
评论
点赞
9
分享

创作者周榜

更多
牛客网
牛客企业服务