数仓面试题:电商数仓销量预测 递归逻辑

投票
辉哥,hive中有没有实现递归的方案?我有个场景,需要循环350次,第二天的数据依赖第一天的数据计算,第三天依赖第二天的数据计算,以此类推到350次。目前用的阿里云的mc,但是CTE只有10次,无法满足该需求。用阿里那边自带的while循环,跑完350次大概要3个半多小时,有没有啥方案可以优化的呀

em,背景就是电商平台的那种预测销量表,比如根据今天的库存,算接下来的350天的值,大概逻辑为:当天的实际库存-季节因子*增长因子+实际需要库存的数量。比如今天预测的11-19号数据,来源于18号,然后将19号的数据写入对应的日期,下一个循环,再从20号拿19号的数据计算。

1. 没有业务数据细节,没有背景,我只能建议udf,或者另外开发java etl
2.用的阿里的,直接向他们要优化方案
3.原数据能不能预聚合下 我看你的需求是不是聚合一个天粒度销量能缓解数据量问题
#实习#  #大数据#  #校招#  #秋招#  #数开#
全部评论

相关推荐

AAA专业长城贴瓷砖刘大爷:这样的简历我会直接丢进垃圾桶,花里胡哨的
点赞 评论 收藏
分享
小浪_Coding:个人技能一条测试没有
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客企业服务