60min左右自我介绍+实习经历介绍一下shufflespark性能优于mapreduce的原因介绍一下宽窄依赖HDFS小文件问题在实习过程中处理过任务优化吗?大数据倾斜问题怎么处理?spark调优手段?Flink的Watermark机制TCP 和 UDP可以简单介绍一下三次握手吗?数据库里边为什么要使用索引B树跟B+树有什么区别点?B+数还有什么特性吗?索引在哪些情况下会失效?介绍一下python深浅拷贝多态了解吗?Java里边的hashmap了解过吗?代码考核一道sql+一道算法题sql:找出至少连续两天在线的用户数算法题没做出来..面试官人很好一直在提醒我,但是还是没做出来..我一直哭继续刷leecode去了