1.ES,ES的项目好几年前接触的了几乎忘光了,被狠狠拷打什么是倒排索引ES写数据流程ES读数据流程项目里ES集群规模,分了几个索引,做过哪些优化来提升性能2.KafkaKafka如何实现高吞吐量Kafka如何保证消息按顺序消费Kafka偏移量怎么保存Consumer出错如何恢复Consumer想从指定时间开始重新消费如何实现3.Spark和FlinkSpark和Flink在使用场景和设计上有何不同什么是shuffle什么是数据倾斜如何优化数据倾斜Flink消费kafka什么情况下会出现数据倾斜之前项目里Spark写数据是往什么地方写的4.其他一些零碎问题,本来想问hadoop和hive,但我们之前项目用的aws,所以改问了s3一些问题,比如s3和传统文件系统相比有什么缺陷,为什么选择s3,s3上的文件能否编辑