滴滴-数据开发实习二面

1. 自我介绍
2. 讲解一下项目
3. 项目中数仓为什么要这样分层。
4. 关于数模比赛项目的问题。xxx
5. 写sql题。

用户访问日志:user_id, device_id, date
求1. 给定时间2024-06-17 用户、设备的数量,都有重复值,都有可能为空
第一次写法:
        select
            count(distinct user_id) user_cnt
            count(distinct device_id) device_cnt
        from 
             t
        where date_format(date,'yyyy-MM-dd') = '2024-06-07'

追问这样写会导致什么问题,如何解决?
会导致数据倾斜,先提前过滤空值再使用group by,再套一层直接统计
全部评论
请问佬在哪投的
点赞 回复 分享
发布于 2024-06-19 12:07 湖北
怎么样,二面过了吗
点赞 回复 分享
发布于 2024-06-18 22:33 陕西

相关推荐

昨天 14:10
门头沟学院 Java
点赞 评论 收藏
分享
fRank1e:吓得我不敢去外包了,但是目前也只有外包这一个实习,我还要继续去吗
点赞 评论 收藏
分享
湫湫湫不会java:先投着吧,大概率找不到实习,没实习的时候再加个项目,然后把个人评价和荣誉奖项删了,赶紧成为八股战神吧,没实习没学历,秋招机会估计不多,把握机会。或者说秋招时间去冲实习,春招冲offer,但是压力会比较大
点赞 评论 收藏
分享
评论
6
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务