码一下
互联网:京东物流-数据研发工程师-离线数仓(8.14 16:00)一面30min:1.数仓分层2.数据治理3.业务使用的内部表和外部表4.数据倾斜是怎么处理的5.三道sql(join,group by,rank窗口函数、ddl语句删表和删分区)快手-主站-数据开发工程师一面(通用面)-40min(8.17 11:00)1.介绍美团项目2.数仓分层3.join的mr过程4.SQL:pv和uv的计算5.python题:装饰器模式6.Java题:浮点数开平方、二叉树的层序遍历二面(通用面)-45min(8.22 14:00)1.介绍一个最满意的项目1.1用没用过别的解析工具,知不知道spark用什么解析的,calcite对比1.2分层建模理论2.数仓分层理论3.DWD层,不同主题域是怎么划分的4.如果建立一个业务数仓,你会考虑哪些问题,开放式5.Java:有哪些类型的内存结构,堆和栈的区别6.算法题:找前k大的数,堆排和快排适用情况7.如何遍历一棵树,前中后序遍历的区别,访问者模式三面(主管面)-45min(8.29 16:00)1.数据治理都要做什么?2.拉链表是什么以及应用场景3.维度建模理论4.SQL解析的流程5.hadoop和spark的区别6.数据倾斜的场景和解决方案7.数据湖和流批一体百度-小度-数据开发工程师(提前批)一面(KPI,没开摄像头)-45min(8.21 14:00)1.手撕算法,区间2.介绍项目,groupingsets2.1谁在用2.2目的2.3效果,和谁比,指标是什么小红书-数据开发工程师-社区和商业化数仓一面-1h(9.2 10:00)1.数仓分层,被challenge在ODS层做公共逻辑下沉,万一数据***掉了怎么办?放在DWD行不行?2.全链路归因建设的流程?服务端和客户端交互?3.spark查询的优化?数据倾斜4.leetcode:用队列来实现栈5.SQL:查询累计登录天数、连续登陆天数二面-40min(9.2 11:10)1.业务背景是什么,被challenge为什么要用hive离线计算进行预计算,不直接用OLAP2.如何去推动大家去使用这个平台,现在进展是怎么样的3.为什么count(DISTINCT)转换为bitmapunion就能实现指标的逐层上卷4.你怎么看待数据赋能业务字节跳动-数据开发工程师-商业化数仓一面-45min(9.12 11:00)1.数据倾斜2.spark为什么比mr快3.OSI七层模型4.TCP和UDP协议的区别5.数据库索引的数据结构,为什么使用B+树6.bitmap count distinct7.基于hash的shuffle和基于排序的shuffle的区别*腾讯-数据开发工程师-游戏广告一面-1h(9.19 19:00)1.项目中遇到的最困难的点2.排序算法都有哪些分类标准3.哪些算法是稳定排序4.堆排序的时间复杂度是怎么样的5.归并排序用到了什么数据结构、堆排序用到了什么数据结构?6.聚簇索引和非聚簇索引的区别7.索引使用了什么数据结构、为什么索引要使用相应的数据结构8.索引的优劣势9.解释一下spark中的RDD,哪些操作会导致计算的执行10.如何解决数据倾斜,广播算法如何解决数据倾斜11.除了kimball,还有哪些数据仓库的建模理论12.tcp协议和udp协议相比为什么是安全的13.如果有一个非常大的数据包,如何保障它被安全发送14.io多路复用15.进程间和线程间的通讯方式16.如何处理最近30天订单量类似的表设计问题17.Spark ui中有哪些东西,定位数据倾斜,如何优化京东-数据开发工程师-零售数据中台一面-30min(9.22 15:00)1.http和https的区别2.数仓为什么要分层3.接口和抽象类的区别二面-45min(9.26 17:00)1.数开八股2.研究方向滴滴-数据开发工程师-DT一面-40min(9.23 10:00-11:00)数开常见八股,忘了二面-50min(9.23 11:10)1.hadoop小文件的影响2.hadoop nn第一次和第二次启动的区别(fsimage和edits)3.hadoop shuffle过程的三个阶段4.hadoop数据倾斜及解决5.spark的宽窄依赖6.B树和B+树的区别7.Spark的持久化&Checkpoint8.数仓建模理论9.数仓分层理论10.数据库三大范式华为-大数据开发工程师-ICT公共开发部一面-40min(10.11 15:20-16:00)1.响应码200,400,500含义2.常见数据结构3.常见排序算法4.mysql常见引擎,区别5.mysql索引6.手撕:判断一棵树是不是查找树,递归二面-50min(10.11 16:10-17:00)1.深度挖简历,每一段实习都干了什么2.手撕:给定两个二进制字符串,实现二进制加法三面-50min(10.11 17:10-18:00)1.最困难的一件事2.职业规划3.对华为有哪些了解4.研究方向5.兴趣爱好阿里云智能集团-全面风险管理-安全数据-数据开发工程师分享一道SQL题(不知道合不合适)用户规格表(user_spec): 用户分钟业务表(user_value): 两张表,user_spec为用户购买的最大规格表,user_value为用户实际业务使用表(每分钟一条记录,存储的为时间戳)。一、 获取每个用户的业务峰值和对应时间点二、 获取用户超规格的时间点(如果某个时间点业务使用量大于规格即为超规格)三、 连续五分钟超规格认为一次告警,获取所有用户的所有告警(输出user_id,告警开始时间戳、结束时间戳)
点赞 17
评论 1
全部评论

相关推荐

凉风落木楚山秋:哈工爷200也去吗
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务