阿里云CIO数开三面1022

主管面,50分钟

1.问项目1是干什么的

2.问项目2的技术栈

3.问实习的数仓维度建模

4.慢sql优化

5.为什么选择数据开发而不是前后端测试

6.为什么不去美团

7.做过数据治理和实时计算吗,讲解

8.美团的mafka和kafka的优势

9.分布式计算mapreduce过程

10.集群发生故障怎么样保证数据安全?

11.如何跨集群保证数据安全?

两个手撕

12.要求c语言,不能用函数,问字符串中最长不重复子串,滑动窗口 哈希表(用数组设置)

13.多个用户多个行程id,每条记录是一个用户某一个行程,有起始时间 结束时间 起始地点 结束地点 费用,统计用户和航班的起始时间地点和目标时间地点 总费用

输入 用户 ID 行程 ID 起始时间 起始地点 目标时间 目标地点 行程总费用(元) user001 trip001 2024-10-01 08:00:00 北京 2024-10-01 10:30:00 上海 1250.00 user001 trip001 2024-10-02 14:00:00 上海 2024-10-02 16:20:00 广州 950.00 user002 trip003 2024-10-01 09:00:00 广州 2024-10-01 12:00:00 深圳 320.00 输出 用户 ID 行程 ID 起始时间 起始地点 目标时间 目标地点 行程总费用(元) user001 trip001 2024-10-01 08:00:00 北京 2024-10-02 16:20:00 广州 2200.00 user002 trip003 2024-10-01 09:00:00 广州 2024-10-01 12:00:00 深圳 320.00

反问:部门未来前景、面试流程

注重应届生什么能力:技术栈的广度

全部评论
同学,瞅瞅我司,医疗独角兽, 因为新业务扩展,11月校招HC暴增! 我的主页最新动态,绿灯直达,免笔试~
1 回复 分享
发布于 11-17 09:21 广东

相关推荐

1.列举几种数据倾斜的情况,并解释为什么会倾場咏,以及如何解决?2.解释一下 SQL 运行步骤,是否有优化空间如果有,如何优化:SELECT a.id,b.nameFROM a LEFT OUTER JOIN bON a.id =b.idWHERE a.dt='2016-01-01'AND b.dt='2016-01-01';3.已知表 a 是一张内部表,如何将它转换成外部表?请写出相应的 Hive 语句4.用 select 做查询时,用哪个函数给值为null的数据设置默认值?5.Hive 中,建的表为压缩表,但是输入文件为非压缩格式,会产生怎样的现象或者结果?6.订单详情表 ord_det(order_id 订单号,sku_id 商品编号,sale_qtty 销售数量,dt 日期分区),任务计算2016年1月1 日商品销量的 Top100,并按销量降序排序7.某日志的格式如下:pin|-lrequest_tm|-url|-|sku_id|-|amount,分隔符为"-',数据样例为:张三-|q2013-11-2311:59:30-www.jd.com-100023-110.15。假设本地数据文件为 sample.txt,先将其导入到 hive的test 库的表t_sample 中,并计算每个用户的总消费金额写出详细过程包括表结构8.test.log 日志中内容如下左列所示,使用awk 输出右列 4行数据:左列:10-3-jd-dv、2-4-jd-dv、5-7-pv-click、36-24-pv-uv、37-24-pv-uV、24-3-uv-mq右列:10-4-jd-dv、5-7-pv-click、37-24-pv-uv、24-3-uv-mq9.Storm 的分组策略有哪些?
点赞 评论 收藏
分享
评论
2
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务