(1)离线数仓:尚硅谷的电商平台v5.0。感觉难点在于理清业务逻辑,整体下来就是hive写hql, spark一点没用到。这到时候面试怎么包装啊?(2)实时数仓:尚硅谷的flink实时数仓。正在学。本人自然语言处理方向垫底985硕士,准备转大数据,框架看了hadoop,hive,spark,flink,flume,zookeeper,其他的暂时不准备看了,学不完,看了也白看。翻经验帖子说大数据项目做这两个,但目前做完离线数仓的感觉就纯sql boy,这….自己学的时候数据规模小的离谱,基本也没碰到大bug,做完感觉平平淡淡…1)单上面两个项目感觉不够?各位大神又啥建议吗。2)或者还有其他框架需要补?3)需不需要单独找一个spark的项目练一下spark ,比如spark - streaming的项目?