大数据平台开发(卓望一面)

感觉这种岗位需要综合性人才,我太菜了
1. 自我介绍
2. 有java代码经验吗,有java开发经验吗?能说一下后端开发的流程吗?如何用spring boot开发一个接口?
3. java创建多线程有哪些方法?可以对线程命名吗?守护线程和非守护线程有什么区别?
4. futureTask和传统线程有什么差异?
5. 介绍一下hashmap?扩容机制是什么?涉及到数据的迁移吗?插入的过程
6. 平时有用代码写一些组件,或者看一些开源代码?
7.  hive有几个进程?客户端连接hive的时候,hive server2可能到达一个瓶颈了,想要扩展hive server2的话,如何去操作,并实现一个负载均衡? 如果你要做这件事情?你能说说你的思路
8. 负载均衡的组件你知道有哪些吗?常用的负载均衡的算法有哪些?
9. hive的外部表和内部表的区别?外部表可以分区吗?
10. hive有哪几种存储格式?列存储相对于行存储的优势?行存储在统计分析中有什么好处吗?
11. hive的调优你能说说吗?你能说说skewindata的原理吗?
12. yarn的资源调度器?容量调度也会借调资源的
13. kafka的分区有什么用?离线和实时的核心区别?
14. 你最近有学什么东西吗?
反问:公司的业务和数仓架构?
全部评论
为啥大数据问你JAVA和后端的东西,我C++的给我面试机会了,不会是kpi吧
点赞 回复 分享
发布于 2024-10-24 14:26 广东
请问uu是投的大数据开发岗位吗
点赞 回复 分享
发布于 2023-10-25 18:16 香港
已经收到感谢信了
点赞 回复 分享
发布于 2023-10-19 11:35 江苏

相关推荐

面试官人很好,态度和蔼可亲,没答出来时也会引导你去思考。由于是晚上面的,导致我白天一天都有点紧张,面的时候状态也不是很好,正常可能面试官提问完应该思考几秒再答,而我就像抢答一样一口气把所有会的都说出来,这样就导致逻辑比较混乱,东一句西一句的。首先是自我介绍,先把会的技术大致讲一下,由于我八股背的多所以着重讲了一下,Java,go,jvm,MySQL,Redis,计网,操作系统这些,然后一小部分闲聊,然后先问了一下项目,面试官问我这个项目是否落实之类的,直接坦言说是写的练手的,包括之前也写过IM通讯,外卖之类的。然后面试官就把提问的重点放在了八股上。先问了Java:类加载器(答:3种+自定义类加载器、tomcat、原因+双亲委派+好处)JVM参数(答:xmx,xms,newsize这些,问我是如何设定的,我回答是把内存分一半给堆,再把堆分一半给新生代,这方面确实不太了解)然后问了一下并发相关的:线程池(答:线程池的7个参数(忘了线程工厂和阻塞时间了),3个重要参数,还有线程如何启用,为什么要设计最大线程数之类的,提到Java栈默认分配1MB运行时不可以更改)AQS(答:先讲clh是自旋锁+list,然后是AQS在这个基础上做的两个优化,然后举了一下reentrantlock根据state如何获取资源)CAS(答:使用三个字段,aba问题,然后将通常搭配自旋锁实现,面试官问通常会自旋多少次,这个不太了解,答的100,然后问100次大概多少秒,回答微秒级,然后面试官讲了一下怎么做资源可能没用完,意识到可能还需要进行阻塞操作)然后考虑一下Linux命令(top,ps,如何使用管道符过滤线程和使用Linux启动线程没答出来)然后问Redis:持久化机制(答:三种aof,rdb,混合,aof的三个参数刷盘策略,rdb以快照保存,使用bgsave会使用子线程来保存不会阻塞,而aof虽然会阻塞但是只在写完数据后追加一条命令,不会太影响,然后是他俩的优缺点,还有混合是怎么保存数据的)集群模式(答:三种,主从复制到缺点再到哨兵机制,正常使用三个哨兵互相监督,主节点挂了投票选主哨兵然后选主节点,然后额外讲一下脑裂的问题,主节点进行数据更新然后把命令写入aof来同步从节点,最后cluster集群,如何实现,使用16383个哈希槽(艹答成16384了),先根据哈希码取余,再根据节点数取余决定放在哪个节点上,然后问了一下我会怎么选集群模式,首先是cluster的问题,会让管道操作之类的失效,然后哨兵会导致整个集群结构变得复杂,使用小项目可能会考虑哨兵,大的考虑cluster,然后考了一下cluster如果一个节点挂了怎么办,根据节点数重新取余然后数据转移,面试官说这么转移比较慢,有没有别的办法,我隐约记得使用一个类似环形数组的方式,想不起来了)然后考了一下MySQL的b+树(这方面的知识点太多了,导致我什么都想讲逻辑就比较乱,讲了一下聚簇索引,树的叶子节点对应着一张页16KB,MySQL有一个区的概念,把这些页放在同一个区中,这样叶子节点的双向链表遍历时速度更快,然后b+树的扇出比较大(非常二,说成扇度之类的,面试官以为说的是扇区)这样层数就比较小,一行1kb数据的话3层可以放心2000w数据)其他的暂时想不起来了算法是lru,面试官问要不要提示,我说写个,然后写了10分钟左右,说大概写好了,但是面试官指出了2个小错误,第一个马上就改回来了,第二个一直没看出来(大脑这时候已经停止工作了)反问:问学习建议,说根据实际的项目进行深入,考虑应该怎么做,还问了一下组里面是做Java的吗?面试官说他是做go的,组里什么语言都有,语言影响不大,连忙补充了一句我对go的底层有深入源码的学习)结束。总体感觉答得不太好,没有太体现出深度,细节也不够全面。
下一个更好呗:佬,我投完云智一直没消息,多久约的一面啊
查看14道真题和解析
点赞 评论 收藏
分享
评论
4
24
分享

创作者周榜

更多
牛客网
牛客企业服务