百度数据开发一面

1.自我介绍
2.介绍一下spark的内存模型?
3.动态内存管理中存储内存和执行内存的区别?
4.对堆外内存有了解吗?
5.有了解过oom的几种类型吗?
6.治理过数据吗?举个具体的优化案例?
7.除了提高shuffle并发，还有什么方法能优化?
8.平时在公司平台上使用的大数据组件有哪些?
9.spark是完全基于内存吗?
10.spark的几种join有了解吗?介绍一下?
11.sort join和hash join的shuffle区别?
12除了join，还有哪些操作会引起shuffle?
13.spark shuffle过程中有sort和没有sort的区别?
14.熟悉非等值连接吗?
15.sql题:求次日、三日、七日留存率。
16.如果是日增量的分区表数据量很大，如何进一步处理?
16.需要用distinct吗?代码能否优化?
17.反问环节。

全部评论

推荐最新楼层

04-06 08:06

蚌埠坦克学院嵌入式软件开发

有个烂工作比没有好

在求职过程中，“有个工作总比没有好”这句话听起来有些现实，却往往贴近真相。相比长期空窗，一份哪怕不那么理想的工作，至少能让人保持在职场的节奏中。它提供了基本的收入来源，也让人持续接触真实的工作环境，避免与行业脱节。

烂工作和没工作哪个更痛苦...

点赞评论收藏

04-08 13:16

门头沟学院 Java

武汉小药药面经

【背景】：公司每天会加班到9点，周末双休，实习生150一天，实习加班没有加班费（nt）【结尾】：一面二面都过了，面试官要了我的身份证和学信网，跟我说等一个星期到一个半星期才会安排入职，然后就没后续了...估计是被鸽了一面（技术面）：自我介绍简要介绍你在上一家公司实习参与的项目你们公司的这个项目你是从上到下都参与的吗还是只参与部分模块，你们是怎么分工的MySQL数据库了解吗？索引接口你了解吗？为什么MySQL使用索引查询会比较快为什么不使用Select *java动态代理了解吗动态代理有什么使用场景Redis锁机制你有使用吗？为什么考虑会加锁假如有多个对象要加锁的话你怎么用呢？比如ABC下了单他...

点赞评论收藏

03-03 23:12

已编辑

北京邮电大学 Java

27届找暑期，简历求拷打

书海为家：我来给一点点小建议，因为毕竟还在学校不像工作几年的老鸟有丰富的项目经验，面试官在面试在校生的时候更关注咱们同学的做事逻辑和思路，所以最好在简历中描述下自己做过项目的完整过程，比如需求怎么来的，你对需求的解读，你想到的解决办法，遇到困难如何找人求助，最终项目做成了什么程度，你从中收获了哪些技能，你有什么感悟。

你的简历改到第几版了

点赞评论收藏