小红书数据开发一二面

京东校招内推码: C4K4D

8.19上午十点和十二点,两次面试间隔一个小时左右,面试时长都不超过30min,面完没消息,大概率凉了。

一面:
介绍一下离线数仓项目?
说说你理解的数仓?
数仓为什么要分层?
mapreduce和spark的区别
怎么理解指标?
两个相对简单的sql题

二面:
介绍一下简历中你比较熟悉的一个项目
分主题的目的是什么?
为什么使用HBase存储维度表,怎么考虑的?
HBase原理了解吗,和其他数据库比较有什么有优缺点?
介绍下flink
flink中对时间的定义
一个事件从source到sink是怎么被执行的?
介绍下时间如何推进,迟到数据如何处理?
flink窗口什么时候触发?
全部评论
有约hr面嘛
1 回复 分享
发布于 2023-08-24 18:34 北京
约hr了吗
点赞 回复 分享
发布于 2023-09-05 20:58 北京
有后续吗
点赞 回复 分享
发布于 2023-09-02 14:07 北京
广告架构还是数据平台呀
点赞 回复 分享
发布于 2023-09-01 10:09 广东
连续面试啊?
点赞 回复 分享
发布于 2023-08-23 21:44 四川

相关推荐

09-09 11:25
山东大学 Java
1、自我介绍2、挑一个项目来介绍一下3、Java 的 GC 过程会有 Stop the World,谈谈为什么要有 STW 的机制?4、谈谈 Java 的SGC、G1、ZGC 垃圾回收器5、G1 已经很不错了,为什么还要有 ZGC 这样的垃圾回收器,为了解决什么问题?6、比如一个订机票的场景,涉及多个外部系统,首先要去看有没有票,然后第二个是支付要调支付宝或者微信去做付款,定完票可能过了半个小时才告诉我订票有没有成功。对于这种场景下的分布式事务,你认为怎么去处理和设计来保证一致性比较好?7、基于消息传递的方案,消息可能传递失败,如何解决?8、如果用消息队列,这种场景,怎么做技术选型?9、做题:新兵报到,指导员命令所有人按身高大小,从低到高,依次站好,每次从头这边开始调整,但是要求,每次一次只能进行一次交换。输入 N(N <=  20),输出 N 个士兵最终的排列结果。示例:N = 5,heights = [170, 167, 180, 175, 168],输出:[167, 168, 170, 175, 180]10、谈谈基于数据库的方式如何实现分布式锁?11、谈谈基于 Redis 如何实现分布式锁?12、为什么基于 Redis 实现分布式锁时,Set 命令要加 PX 参数?13、基于数据库方式实现和基于 Redis 实现的区别?应用场景?14、反问
查看13道真题和解析
点赞 评论 收藏
分享
评论
5
28
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务