小米大数据开发实习面经
1. 自我介绍
2. 问了一下简历上的项目(研一在国电做的)
3. Spark有没有过调优
4. 基于我对Spark调优的一些回答进行追问:
● 我提到了利用RDD缓存进行RDD复用,追问Spark缓存一般可以用什么函数做到(cache,presist)
● 追问并行度的设置方法(配置文件或在代码中)
● 并行度的值一般根据什么设置(CPU核数的2-3倍)
5. Hive执行原理(SQL到MR的过程)
6. 问了ElasticSearch(因为我简历写了这个,介绍了倒排索引)
7. 问了离线数仓的项目
8. 问了Flink和Spark Streaming的区别(一个微批次,一个面向流)
9. 追问两者在API的使用上怎么体现面向微批次和面向流
10. 什么算子会导致Spark产生Shuffle
11. MySQL有哪些引擎,之间有什么区别
12. 算法题(最长上升子序列 力扣题号300)
13. 翻转链表(面试官问能否用递归的形式实现,只要当前不为空,就继续调用即可)
整体过程还算顺利,后面有俩八股问题答得不是很完美,面试官问能不能尽快到岗,我因为导师项目在出差,3月没法回北京,就说得4月份,他说他们需要尽快到岗的,希望我考虑考虑,所以估计吹了,挺可惜的
#我的实习求职记录#
2. 问了一下简历上的项目(研一在国电做的)
3. Spark有没有过调优
4. 基于我对Spark调优的一些回答进行追问:
● 我提到了利用RDD缓存进行RDD复用,追问Spark缓存一般可以用什么函数做到(cache,presist)
● 追问并行度的设置方法(配置文件或在代码中)
● 并行度的值一般根据什么设置(CPU核数的2-3倍)
5. Hive执行原理(SQL到MR的过程)
6. 问了ElasticSearch(因为我简历写了这个,介绍了倒排索引)
7. 问了离线数仓的项目
8. 问了Flink和Spark Streaming的区别(一个微批次,一个面向流)
9. 追问两者在API的使用上怎么体现面向微批次和面向流
10. 什么算子会导致Spark产生Shuffle
11. MySQL有哪些引擎,之间有什么区别
12. 算法题(最长上升子序列 力扣题号300)
13. 翻转链表(面试官问能否用递归的形式实现,只要当前不为空,就继续调用即可)
整体过程还算顺利,后面有俩八股问题答得不是很完美,面试官问能不能尽快到岗,我因为导师项目在出差,3月没法回北京,就说得4月份,他说他们需要尽快到岗的,希望我考虑考虑,所以估计吹了,挺可惜的
#我的实习求职记录#
全部评论
jyx😳?
你好,请问这个小米大数据笔试考sql还是考编程呀。
问一下研一的项目是自己找的还是实验室的项目呀
佬,数仓开发对算法题要求高吗。。大概得刷多少题
感觉刷完就忘,没什么效果。自己还写不出来

佬 是自动驾驶部门嘛
这是二面吗
感谢大佬分享
兄弟小米实习有笔试吗,面了几轮啊
相关推荐
二十岁的编程男神王大...:那这个时代是什么时代呢? 是全员agent的时代,是前端+AI,后端+AI的时代,AI已经融入了项目生命周期的的每一个角落,那我最近在做的东西举例,检查BUG时,我们会用codex,CC等工具的skill去check,效果好还能直接fix,测试的时候,apifox等工具已经有了AI落地的改造,CI/CD阶段,我们会根据hook去跑AI check脚本,就连不少中间件,也迎来了AI落地的改造,(AI网关,AI在MQ中的运用),都可以去了解下
另外记着,这些东西不是意义,工作只是谋生的一个手段,ai是让开发提效了,但是呢,原先一周的工作流程压缩到了两天内,同时低级的都裁员了,只有高级的去维护,你看似写的大义凛然,或许那天你也会成为你文章里面拒绝往前走的人,你才大二,面对技术有热情是对的 点赞 评论 收藏
分享
