实时数据质量异常排查思路

群友提问:离线小时看板数据和实时看板数据对不上该怎么排查。

首先定位问题中架构为HSAP OR LAMBDA。

指标口径

先看指标口径是否准确,保障实时和离线指标口径一致,以及线上版本,同时看代码版本改动记录如指标口径及数据源,如果都没问题则继续向下排查。

消费情况

看dwd清洗加工代码中是否有加filter处理,以及多表明细join情况是否有空,如果未做处理同时未有空值,则看 flink ui 查看dwd/ods数据消费情况,如数据反压则按照反压排查思路,如数据质量还是有问题(例如正常指标每日gmv在100w附近,今日变20w),则去回查mysql/kafka源头情况,同时保障数据来源一致。

重新拉取消费和离线比对

最后则是发布任务启动任务后,重置消费点位(例如今天9月19日),今天数据离线肯定是没有的,那我们就重拉9.17到现在的点位,1看明细条数和离线能否比对上,2看指标和离线比对如何(这里可以先把数据落OLAP 存一份),再将OLAP中数据GROUP BY 到小时,去看实时落库每小时指标数据,再写离线sql看离线每小时指标数据(例如离线 9.17日 13点 gmv10w,14点20w),如可以对齐或者差距在3%以内都可以正常发布。

#数据人offer决赛圈怎么选##数据人的面试交流地##数据分析##数据开发##大数据#
全部评论

相关推荐

1. 基本情况方向:数据工程,时间:40分钟结束、16:00开始,无手撕,多场景2. 自我介绍3. 一些能够回忆起来的(或许有不正确的地方):(1)提问R:你这个项目是课程作业还是什么?R:那你说说Hive和ClickHouseR:你谈到了OLAP,那和OLTP有啥区别?R:没了?ClickHouse适合那种场景?R:可以用作实时数仓吗?R:课程中有数据库相关的吗?只有数据结构与算法?R:MySQL系统学习过吗?R:数据怎么导入到ClickHouse的?R:直接到ClickHouse?R:数仓分层?四层讲讲。R:那为什么要分层呢?DWS已经差不多了为什么还需要ADS呢?R:场景题:在你的表上新...
牛客861513826号:A场景题:数量统计不说了;退货平均时间:先沟通清楚,月平均退货时间算不算上不退货的用户,不算的话,就只计算退货用户;一个用户的退货时间减去到货时间拿到这件商品的退货时间,然后计算每个退货用户的退货时间,AVG开窗partition by月份,计算出每个月的平均退货时间。如果要算上不退货的用户,也就是让这个用户的退货时间是0,然后对所有用户计算AVG同上。 B场景题:结合下面他提示你再想想数据倾斜,其实这道题是想靠你数据倾斜怎么解决;本来是一个商品购买信息表,记录商品信息和购买者信息,如果给购买者信息加上性别,要求算出每个商品不同性别的购买人数。百分之八十女性用户,所以如果单纯对表进行分组聚合,会产生数据倾斜问题,由分组聚合产生。五种办法可以解决,两种hive参数,三种SQL,往SQL方向聊,以防他追问参数底层,参数这种东西最难聊了,别给自己挖坑
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客企业服务