社招-数据仓库面试

Gaussdb是什么数据库
Gaussdb和Doris有什么区别
数据湖和数据仓库有什么区别
hudi中你们用的哪种表类型
hudi怎么实现实时数据更新的
HIVE有哪些模块
知道HIVE的thrift吗,有什么好处
生产中是用哪种方式连接HIVE的,会用jdbc连接吗
知道哪些spark的运行模式
yarn-client和yarn-cluster的区别是什么,从中选一个运行模式具体介绍下
select a,sum(b) where c>0 group by a。spark中是怎么实现的,你觉得这个语句什么情况下会出现数据倾斜,怎么优化它
spark中小文件你怎么处理的
我想将数据只写入到10个文件里面,怎么处理,distribute by cast(rand()*10 as bigint)
怎么将a字段的值一样的数据写入到同一个文件,并最后只生成5个文件 distribute by mod(a,5)
Spark中的Job、stage、task是什么关系
spark的Job可以并行执行吗,stage可以并行执行吗,什么情况下stage可以并行执行,举个stage并行执行的例子
Flink怎么处理积压的
Flink的Exect-Once怎么实现的
java的内存空间分哪些
怎么让栈空间溢出,怎么让元空间溢出
工作中会遇到内存溢出的问题吗
内存溢出了你会怎么去分析
知道哪些序列化方式,Serializable和protobuf
protobuf与Serializable序列化的区别
了解数据库连接池吗,是什么原理
了解线程池吗,介绍下你知道的
SpringBoot相对于Spring MVC的优点
Spring中的注解了解哪些
数据库的事务知道吗
事务的隔离级别有哪些,默认是那种隔离级别
你觉得你们公司目前有哪些方面可以改进的,比如工作上的改进、平台上的改进
你工作中遇到了哪些难题,怎么解决的
作为你的同事,你觉得你能带来什么好处
你最近有去学习什么新东西吗,从中学到了什么
为什么想来我司所在城市
你未来的职业规划是什么

#社招面经#
全部评论
不要小看了现在找工作的难度
2 回复 分享
发布于 2024-04-25 13:47 湖南
太难了,看着
点赞 回复 分享
发布于 03-14 15:41 上海
点赞 回复 分享
发布于 01-10 11:14 湖南
这是哪个公司啊,面这么底层?
点赞 回复 分享
发布于 2024-05-22 10:29 上海
你这个难度有点高啊
点赞 回复 分享
发布于 2024-05-22 08:56 北京
老哥,数仓要面这么底层的问题吗
点赞 回复 分享
发布于 2024-04-29 11:06 浙江
数据开发需要学这么多吗
点赞 回复 分享
发布于 2024-04-18 05:19 山西

相关推荐

1. 基本情况方向:数据工程,时间:40分钟结束、16:00开始,无手撕,多场景2. 自我介绍3. 一些能够回忆起来的(或许有不正确的地方):(1)提问R:你这个项目是课程作业还是什么?R:那你说说Hive和ClickHouseR:你谈到了OLAP,那和OLTP有啥区别?R:没了?ClickHouse适合那种场景?R:可以用作实时数仓吗?R:课程中有数据库相关的吗?只有数据结构与算法?R:MySQL系统学习过吗?R:数据怎么导入到ClickHouse的?R:直接到ClickHouse?R:数仓分层?四层讲讲。R:那为什么要分层呢?DWS已经差不多了为什么还需要ADS呢?R:场景题:在你的表上新...
牛客861513826号:A场景题:数量统计不说了;退货平均时间:先沟通清楚,月平均退货时间算不算上不退货的用户,不算的话,就只计算退货用户;一个用户的退货时间减去到货时间拿到这件商品的退货时间,然后计算每个退货用户的退货时间,AVG开窗partition by月份,计算出每个月的平均退货时间。如果要算上不退货的用户,也就是让这个用户的退货时间是0,然后对所有用户计算AVG同上。 B场景题:结合下面他提示你再想想数据倾斜,其实这道题是想靠你数据倾斜怎么解决;本来是一个商品购买信息表,记录商品信息和购买者信息,如果给购买者信息加上性别,要求算出每个商品不同性别的购买人数。百分之八十女性用户,所以如果单纯对表进行分组聚合,会产生数据倾斜问题,由分组聚合产生。五种办法可以解决,两种hive参数,三种SQL,往SQL方向聊,以防他追问参数底层,参数这种东西最难聊了,别给自己挖坑
点赞 评论 收藏
分享
评论
5
23
分享

创作者周榜

更多
牛客网
牛客企业服务