小红书数据平台数开二面1009

35分钟,感觉要凉

上来5分钟自我介绍,然后15分钟手撕

1.查询最近一年连续登陆超过7天的用户

字段user_id login_date

基本题了,秒了。

10分钟问实习

2.实习中业务项目从数仓建模到落实的每个环节行动(正常回答)

3.你觉得数仓建设的标准是什么,怎么判断数仓做的好还是不好(应该是贴近业务、数据准确、灵活拓展)

4.了解一些大数据引擎的原理和源码吗(开始懵逼,说了个spark)

5.对spark的原理讲述(讲了一通)

然后面试官说没问题了,让我反问(g)

反问业务、加ai的浪潮、作息、可以提升的点(对大数据引擎更了解一些)

全部评论
整体上不是很难,只有评价数仓的好坏需要讲一下自己的理解
点赞 回复 分享
发布于 10-10 11:02 北京

相关推荐

09-17 18:41
门头沟学院 Java
📍面试公司:小红书🕐面试时间:9.11 三天后挂💻面试岗位:后端开发❓面试问题:1.自我介绍2.实习拷打7.场景题:直播平台需要实时统计每个直播间的在线人数(观众进入/离开直播间时需要实时更新),并支持查询指定直播间的当前在线人数。要求系统在高并发场景下(如热门主播直播间同时在线100万人(高点直播间进房QPS=15W,离房QPS=5W),同时在线直播间10W)保证数据准确性和性能。设计思路。8.你说使用AtomicLong去进行加减,本实例的数据加减完之后存放在哪里?9.这样子的话单机的话应该是没什么问题的,如果是分布式场景多台机器应该怎么办呢?10.你说引入消息队列,这是在哪一个环节进行的?是用户进房/离房的时候发消息吗?11.用Redis的话你说用哈希去存,哈希存的是什么东西?12.假设你说的没问题,现在同时有10万个直播间,你用一个Redis的哈希结构来存,会不会有问题?用什么方法可以解决这个问题呢?13.在你的实习过程中,用户的权限应该也是落到Redis上的,是把所有用户都放到一个Redis的哈希结构吗?当时是怎么弄的?14.你说要把直播间做一个分片,根据直播间ID去做分片再落到不同的Redis,那为什么不直接把直播间ID作为Key呢?15.用Redis的哈希结构意义是什么?16.你说通过ID哈希取模再分片的方式,如果开始每一片的Redis key存了1000个用户ID,后期用户增多到100万,扩容怎么做呢?重新物理哈希吗?17.一个用户存一个Key的方式可行吗?18.针对10个分片,每个分片上1万个直播间,会不会存在什么性能问题?19.对redis集群有什么影响?20.如果有过载的情况,我们要怎么处理?21.手撕:跳跃游戏
查看17道真题和解析
点赞 评论 收藏
分享
评论
1
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务