什么是数据倾斜?如何发现和解决?

考察点:分布式数据库特有问题的处理能力。

参考答案

  • 定义:数据分布不均,导致部分DN存储数据量远大于其他DN,造成单点瓶颈
  • 发现方法:sql
  • 解决方案:更换分布键:选择区分度更高的列,如用user_id替代city复合分布键:组合多个字段,如(city, user_id)加盐(Salting):在分布键后加随机数,打散热点数据调整分片数:扩容增加分片,重分布数据
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务