虾皮一面-数开
手撕:
问了下比较熟的编程语言(java)
连续子数组最大和多少
知道虾皮是干嘛的吗
SQL 求销量表,每个类别下售量TOP10的商品id
排名连续怎么做
衣服这一品类数据量特别多,导致数据倾斜怎么处理,只针对这一场景处理
(二次聚合)
给谁加随机值,怎么加,举例
还有别的方法吗,只针对这个情景
你知道spark有做这件事吗(压缩)
自己工作中会开这个配置吗
spark和flink哪个比较熟,或者其他组件哪个学的好,可以自己挑个熟悉的来讲,还是随便挑个问
1.flink状态后端知道哪些
2.讲一下checkpoint是在干嘛
3.如果状态后端是Rocksdb,checkpoint是怎么存的
4.一个算子是怎么知道自己该做checkpoint
5.从checkpoint恢复的时候,怎么做的
6.一个算子,怎么知道恢复时应该读哪份文件
7.看过checkpoint文件里面的结构吗
8.有遇到过从checkpoint恢复时失败,是由于算子找不到从哪恢复的问题吗
spark方面的问题
1.executor, 他的内存分成几部分?堆内堆外内存区别?为什么会有堆内堆外内存
2.在shuffule的过程中,这几部分是否/如何参与其中
3.节点0OM,我有哪些方法或者配置,去优化?
问了下比较熟的编程语言(java)
连续子数组最大和多少
知道虾皮是干嘛的吗
SQL 求销量表,每个类别下售量TOP10的商品id
排名连续怎么做
衣服这一品类数据量特别多,导致数据倾斜怎么处理,只针对这一场景处理
(二次聚合)
给谁加随机值,怎么加,举例
还有别的方法吗,只针对这个情景
你知道spark有做这件事吗(压缩)
自己工作中会开这个配置吗
spark和flink哪个比较熟,或者其他组件哪个学的好,可以自己挑个熟悉的来讲,还是随便挑个问
1.flink状态后端知道哪些
2.讲一下checkpoint是在干嘛
3.如果状态后端是Rocksdb,checkpoint是怎么存的
4.一个算子是怎么知道自己该做checkpoint
5.从checkpoint恢复的时候,怎么做的
6.一个算子,怎么知道恢复时应该读哪份文件
7.看过checkpoint文件里面的结构吗
8.有遇到过从checkpoint恢复时失败,是由于算子找不到从哪恢复的问题吗
spark方面的问题
1.executor, 他的内存分成几部分?堆内堆外内存区别?为什么会有堆内堆外内存
2.在shuffule的过程中,这几部分是否/如何参与其中
3.节点0OM,我有哪些方法或者配置,去优化?
全部评论
后面的问题这么难吗
相关推荐
mata川152:实习怕啥
点赞 评论 收藏
分享
10-14 21:06
西北农林科技大学 数据分析师 点赞 评论 收藏
分享