上海 xxx 大数据面经

6.6 下午3:45左右 4:15左右出  30min
1. 自我介绍
2. 哪里人(自我调侃
3. 你觉得你有xx人的那些品质吗?
4. 做过班长是吧,为啥又不干了呢?
5. 学校党员多么?
6. 为什么想做开发?大环境也不行,为啥还要入行开发?
7. 你的学历不占优势、以及大环境这么差,你怎么保证你的能力可以干开发呢?你怎么卷得过别人?
8. 你说你喜欢技术,不做管理路线?所以想发展到架构方向了?
9. 在你面前抽烟能接受么,来一根?(不抽烟,推了
10. 你觉得你做开发需要的能力是什么?你最需要提升什么能力?
11. 提到AI,你都用过哪些?
12. 能干销售吗?能演讲吗?
13. 你上一段实习做的什么?(社群运营)为啥要去那个实习?面试过程是什么?
可能还有点细节忘了
然后是开始介绍他们公司,加班的看法、要求等
反问:
用的什么技术栈:分布式很少微服务、SpringBoot那一套
上班时间:9:30 - 18:00 加班少,项目紧才会(不好说是不是真的
最后:
大数据了解吗?在学校用过数据平台吗?
说还有什么问题?没了
全部评论
看起来就 好。。。好害怕 请问最后结果如何呢
点赞 回复 分享
发布于 08-27 12:47 澳大利亚
《在你面前抽烟能解决吗》我能说不接受吗
点赞 回复 分享
发布于 06-15 11:53 上海
你好问一下,三本有机会嘛。。。不要求大厂
点赞 回复 分享
发布于 06-13 16:49 浙江
感觉有点像hr面的问题
点赞 回复 分享
发布于 06-06 22:50 上海

相关推荐

1.WordCount 具体是怎么跑的?比如怎么分片、map 阶段做了啥、shuffle 是咋回事、reduce 最后怎么汇总的2.MapReduce和Spark 到底差在哪儿?适用场景这些都得对比着说3.Spark 提交任务时,Client模式和集群模式有啥不一样?比如 Driver 在哪跑、日志在陖瞎圈看、适合啥场景4.同一条 SQL,为啥 SparkSQL 跑起来比HiveSQL 快?得从执行引擎、优化器这些底层说说原因5.自定义 UDF 怎么实现?比如在 Hive 或Spark 里,具体步骤是啥,有没有踩过坑6.设计 HBase 表得注意啥?rowkey 怎么设计才合理、列族要不要分、版本数怎么设,这些睪腘狐旨を曽斷纰可能问到7.HBase 里的 HLog 是干嘛的?跟数据持久化、故障恢复有关系吗8.都是存在 HDFS 上的数据,为啥 HBase 能支持在线实时查询,Hive 就不行?底层存储结构不一样在哪9.用 SparkSQL 操作 Hive 数据时,有没有縈区堠浓ゴ壮攥到过兼容性问题?比如某些函数不支持、数据格式读不对之类的,怎么解决的10.Spark Streaming、Storm、Flink 这几个流处理框架,区别在哪?各自的优缺点和适用场景得搞明白场景题:11.数据量特别大,要用三个 Map 和一个Reduce 来做 Top10,哪种方法效率最高?得考虑怎么减少数据传输、避免倾斜
查看11道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务