一、背景 大数据时代,对数据的使用分析频繁,在数仓层面对数据的管理组织都在考虑用新的技术方案实现更快速的数据计算,算力的发展是底层引擎迭代的驱动力;从最最初的MR计算框架到现在的基于Rdd的内存计算模型,再到向量化计算优化,一步步追求更高性能的计算。数据模型的发展也是从最初的银行范式建模,到现在迭代快速的维度建模反范式建模,团队发展从最初的中台团队到现在的BP模式,都在追求极致的效率。目前,在对数据模型层面对长周期的数据进行访问都在追求避免对底层明细数据的过多扫描,从而实现模型计算效率的提升。本篇重点剖析几种数据压缩方案。主要是基于二进制压缩的方案进行数据模型的压缩。 目前,在对实体进行历史周...