苏州思必驰数据开发一面回顾

1.ES,ES的项目好几年前接触的了几乎忘光了,被狠狠拷打
什么是倒排索引
ES写数据流程
ES读数据流程
项目里ES集群规模,分了几个索引,做过哪些优化来提升性能
2.Kafka
Kafka如何实现高吞吐量
Kafka如何保证消息按顺序消费
Kafka偏移量怎么保存
Consumer出错如何恢复
Consumer想从指定时间开始重新消费如何实现
3.Spark和Flink
Spark和Flink在使用场景和设计上有何不同
什么是shuffle
什么是数据倾斜
如何优化数据倾斜
Flink消费kafka什么情况下会出现数据倾斜
之前项目里Spark写数据是往什么地方写的
4.其他一些零碎问题,本来想问hadoop和hive,但我们之前项目用的aws,所以改问了s3一些问题,比如s3和传统文件系统相比有什么缺陷,为什么选择s3,s3上的文件能否编辑
全部评论

相关推荐

不愿透露姓名的神秘牛友
11-01 12:57
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务