2023秋招—数据开发面经—美的

线下群面:

五分钟读题,然后每人简单自我介绍+说出对题目的答案,然后讨论20分钟,最后5分钟派一个人总结。

题目:(2选1)

1、如何构建数据中台?

2、设计一个智能家居,应该有哪些功能?用什么技术实现这些功能?

测评:

性格测试+图形推理+资料分析

二面:

1、自我介绍

2、详细介绍一下项目

3、实习的数据框架和项目的数据框架有什么区别吗?

4、数据采集还了解其他工具或架构吗?

5、数据加工处理还了解其他工具或架构吗?

6、数据对外提供服务还了解哪些工具?

7、介绍一下实习中大数据开发的流程和规范

8、编译原理、数据库原理有了解过吗

9、做题,说思路就好:(不用借助其他平台,想思路就好)

上百T数据,里面有手机号,有5台机器,找出手机号出现频率最高的10个。

自己的思路:将数据分为5份,让每一台数据处理一份,分别对数据进行排序,取出出现频率前10的手机号,最后把5台机器的结果汇总起来再进行排序,取出前10频率的手机号。

面试官:那每台机器怎么取出频率最高的10个手机号?

我:HashMap存储处理过的数据,key存放手机号,value存放出现次数,然后用小顶堆存放HashMap的数据,取10次堆顶的数据。

面试官:每台机器取前10,加起来再取前10,但每天机器的前10不一定是准确的,即可能出现同一个手机号出现在不同的机器,怎么处理?(一开始理解错了问题)

我:扩大前几的范围,前20、前50

面试官:这个方法不解决问题,参考MR的计算原理,借鉴一下有没办法解决?

我:(根据MR处理数据的流程说了一遍)

面试官:了解Shuffle吗?

我:了解,数据分区......

面试官:对,就是Hash分区,先让相同的手机号放到同一个机器上,后面那套就通了,这个手机号就是这台机器的前10。

大数据——海量数据处理的基本方法总结:

https://blog.csdn.net/hong2511/article/details/80842704

(数据进行Hash分区,分为5个文件,分别发给5台机器处理。每台机器用HashMap统计词频,然后用第一个文件建立一个小顶堆,只存频率最高的10个,然后第二个文件继续存入小顶堆。最后小顶堆里存在的10个号码就是最高频的)

10、反问

部门规模:数据业务中心,200多人,负责所有的数据建设和管理

技术栈:需要用到什么就用什么,没有特定的技术栈,不限于某种技术

候选人特质:没有特别倾向,对基础能力的掌握情况,对做过东西的了解程度,不仅仅是完成,做完后对背后的东西有比较好的理解。

二面挂,个人分析是场景题没有做出来

#数据人的面试交流地##面经分享##大数据开发工程师面经##数据开发工程师面经##大数据开发面经#
个人面经 | 大数据开发 文章被收录于专栏

主要记录个人在2023校招中的面试问题,欢迎订阅、收藏、评论、转发

全部评论

相关推荐

先说说目前面试进度,我是在BOSS直聘投的简历,然后京东安排面试,一面面试完成过一天安排2面2面面试完过一天安排3面,3面去线下面,面完你会遇到你今后的直属领导,下面来说说面经一面,是个女面试官1 先自我介绍2说说项目以及你目前技术栈3 说说你实时都做了哪些,说说维度建模和范式建模都有啥区别4 平时有遇到数据倾斜吗,怎么处理的5 看你有做财务数据,你认为财务数据和流量数据有啥区别,需要注意什么地方,财务数据你感觉最难的地方是哪里,怎么解决的6 来个场景题,对于一个字段找到其中出现a字母的所有次数7 模型建设规范都有哪些二面 似乎就是大部门leader和hr一起来的1 先进行自我介绍2 说一下做的项目,你扮演了什么角色3 看你实时经验比较丰富,下面来做2个场景题,对于一些交易订单来说,会出现订单出现退款,你如何可以做到订单实时的成交金额目前交易链路存在一个这个问题,交易的订单的渠道信息的某些字段可能会更新,你如何可以实现字段可以实时更新为最新得数据,保证数据不丢4 你平时看实时任务都是怎么看的,实时任务有哪些指标可以衡量,你平时遇到哪些问题,怎么解决的,你认为实时资源该怎么分配,时效性怎么确定5看你经验目前做过流量数据和财务数据,你感觉财务数据和流量数据最大的区别是啥,两者时效性和准确性都有啥区分6 你这边有啥问我的3面 线下面,京东似乎最后一面必须线下面,我去了一趟总部,感觉很大和面试官面对面聊,似乎还是交叉面,应该是别的部门领导,主要是聊了和一面2面差不多问题,不一样的地方是聊了一下数据湖,为啥现在企业都在追求数据湖,数据入湖和出湖都有哪些好处后面进展,似乎面试都通过了开始收集流水,还不知道涨幅怎么样,之前都说京东似乎不能太频繁跳,我这似乎跳的还比较频繁也给过了,可能跳槽不是卡的这么严同步一下后续到了谈薪阶段,目前base不变,加了4个月年终,总包涨30%多点
查看14道真题和解析
点赞 评论 收藏
分享
评论
3
39
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务