顺丰大数据开发工程师凉经

1、能说下实时处理这块搭建的系统的架构吗?
2、SparkStreaming从kafka消费数据,怎么保证不会重复呢?偏移量也不是实时去提交,假如说在消费的过程中,出现重启,这种情况下怎么确保不会有部分数据重复处理?
SparkStreaming有这个机制吗?
3、sparkstreaming的工作过程。
4、采用redis对当日日活设备进行过滤统计,这个怎么理解呢?这样能实时动态的展示日活量吗?怎么统计的日活量?
5、大屏实时显示日活数,怎么做的?这里又用到redis又用到hbase,主要目的是什么呢?
为什么选择hbase呢,市面上也有一些关系型数据库是可以支撑的。
6、phenix的索引怎么做的呢?为什么会提高查询速率呢?
7、根据rowkey去hbase查数据的过程。
#顺丰科技##数据开发工程师##面经##校招#
全部评论
您好,这个面经是因为楼主做过实时处理相关的项目吗?感觉全部问的这块儿的
点赞 回复 分享
发布于 2020-10-01 01:35

相关推荐

Vincent777...:实习经历可以考虑放上去,对于软件使用方面可以细化一些,比如调整为:熟悉基于LSDYNA的瞬态动力学仿真分析,熟悉基于WORKBENCH的结构拓扑优化
我的简历长这样
点赞 评论 收藏
分享
06-26 22:20
门头沟学院 Java
码农索隆:让你把简历发给她,她说一些套话,然后让你加一个人,说这个人给你改简历,然后开始卖课
我的求职精神状态
点赞 评论 收藏
分享
评论
2
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务