滴滴大数据研发实习(已OC)

3.31 一面 27min

自我介绍

聊了会儿天,确认我的实习时间

职业规划是什么

项目介绍,为数不多让我把两个项目都介绍一下的

数仓分层的好处

项目中如何保证数据可靠性的?

项目中任务如何调度的?(crontab 定时脚本)

这样的任务调度有问题吗?该如何优化

spark的优化

sql:给定一个学生成绩表

  1. 列转行
  2. 求课程成绩的排序

反问:

部门业务和技术栈

对实习生的要求是什么

多久出结果

下午2点面,下午5点通知一面通过,约4.1二面

4.1 二面 30min

自我介绍

谈谈自己想做的一个方向(面试官详细的给我介绍了数据相关的一个体系)

掌握的技术,做过实时的项目吗?(回答没有,但了解一点)

了解实时相关技术的程度?

项目中数据可靠性怎么验证的?

项目中有遇到什么问题吗?如何排查解决的

目任务调度?

场景题:真实线上可能有很多任务,若有任务未按时间产出如何排查解决?

使用过调度工具吗?

你觉得如何来对数据产出进行评估(大致是这个意思,我可能描述不是很准确)

sql

给定一张表 event_id,user_id,timestamp

  1. 若相邻时间差在10分钟之内,则属于同一个session,求每条数据的session_id
  2. 基于1,求路径。例如,001,2,2025-09-08,1;002,2,2025-09-09,1;

需要输出001,2,2025-09-08,1,001;002,2,2025-09-09,1,001:002;

第二题没撕出来,但是跟面试官说了一个思路,后面搜了下思路是对的。但是面试官让我再想一种办法,没想出来

反问:

部门业务的开发流程

面试表现有哪些不足的(面试官又帮我分析了下,还教我如何去学习相关知识

面试官都很好,二面面试官还帮我梳理学习路线,未来的职业规划等

面完可能一小时左右,通知面试通过,问是否接受offer

4.2 下午发offer

无实习四非能有offer已经很满足了,顺便问一下有没有也是4.8号入职的朋友

#滴滴求职进展汇总#
全部评论
大佬,想问下数开学习路线是跟什么学啊
1 回复 分享
发布于 05-20 20:02 重庆
大概是这样做的? select event_id ,user_id ,to_date(times) as d ,session_id ,concat_ws(':',collect_list(lpad(cast(event_id as string),3,0)) over(partition by user_id,session_id order by times asc)) as path from( select event_id ,user_id ,times ,sum(session_flag) over (partition by user_id order by times) as session_id from ( select event_id ,user_id ,times ,case when lag(times) over (partition by user_id order by times) is null then 1 when (unix_timestamp(times) - unix_timestamp(lag(times) over (partition by user_id order by times))) > 600 then 1 else 0 end as session_flag from mock_data ) t1 ) t2
1 回复 分享
发布于 04-08 22:57 重庆
可以问一下佬是什么部门吗
点赞 回复 分享
发布于 04-24 19:17 上海
佬,如何保证数据可靠性是咋答的呀
点赞 回复 分享
发布于 04-03 08:35 安徽

相关推荐

05-08 08:07
已编辑
杭州电子科技大学 Java
一面-30分钟实习实习难点技术1. new一个hashmap(6)。它的空间实际多大?如果加对象了是多少?HashMap 会将初始容量调整为大于等于指定容量的最小的 2 的幂。并发场景使用Map2. cas。底层原理3. synchronized4. 集合对象唯一,使用什么?hashset打印有序吗?set如何有序? linkedHashSet5. 索引如何建立?联合索引?联合索引的顺序与索引不一致,查询顺序在哪里优化?6. MVCC7. readview?可见性算法8. 聚集索引、二级索引9. 一般用redis做什么10. redis持久化11. rdb会阻塞主进程吗?快照会记录当前更新的数据吗?12. rdb持久化的时机13. redis主从、哨兵、集群二面-50分钟实习1. 分片上传如何设计的2. 断点续传。如何保证上传过程中分片没有被篡改3. 如何理解注解。为什么要使用?一般会在哪里使用?4. AOP拦截注解,本质通过什么方式?反射5. 如何理解反射?自己使用过吗(aop切面中通过反射获取注解的信息,从而获取到value值)6. Threadlocal怎么使用的技术1. 什么是弱引用?其他引用?为什么有这么多引用?如何应用的?2. 做过线上处理吗3. 如何找到Java进程的id?linux命令,有没有什么工具4. 什么命令可以分析cpu性能?top默认用什么排序?可以使用内存排序吗5. 实习机器配置?6. 假如一个应用,线程数量很多,导致系统运行不稳定,告警,现在有很多系统工具。现在让你去分析,为什么这个应用占用线程,目的是降低它的线程数量,你会怎么做?如何推动这个事情去落地7. 实习最大的收获8. 假如开发阶段,产品提了需求变更,你会怎么做9. rpc、dubbo有用过吗?如何理解?10. redis幂等怎么做的?有哪些问题?如果消息隔一天发送,如果是一周呢?如果不考虑redis库存呢?从技术设计考虑redis幂等有什么问题?11. redis日志12. 近期有写业务代码吗?算法:java代码实现三个线程交替打印1-10二面面试官是个巨佬,非常非常强。介绍很长时间部门业务,日活几百万,以为自己当时能过算法题没写出来,当时还没怎么练习手撕,现在看来很可惜,如果写出来了是不是就过了
点赞 评论 收藏
分享
评论
1
13
分享

创作者周榜

更多
牛客网
牛客企业服务