百度数开一面

面试官挺年轻的,感觉二十来岁,而且全程拷打我spark底层,我估摸着是刚入职八股没忘干净

自我介绍
自我介绍我一般说,我是谁,来自xx学校,然后熟悉xxx技术栈,在xx实习,职责是xxx。

介绍实习(5min左右)

开始八股
数仓建模
1. 讲讲维度建模
2. 讲讲事实表和维度表,讲讲事实表几种类型
3. 讲讲事务性事实表和周期快照事实表的区别,应用场景
4. 为啥不用事务性而用周期快照
5. 讲讲拉链表

Spark
5. 讲讲spark底层做了哪些优化(我讲了列裁剪+分区裁剪)
6. 为啥行式存储不能列裁剪,非要列式存储
7. 讲讲列式存储底层是怎么做裁剪的
8. 为什么谓词下推不叫谓词上推,不是将where/on条件提到靠近数据源的地方吗
9. 讲讲shuffle底层(我讲了hashshuffle和sortshuffle)
10. sortshuffle一定会排序吗(bypass机制)
11. 讲讲宽窄依赖
12. 讲讲广播变量底层实现
13. 如果变量不在driver端广播,而是在executor端怎么办
14. 讲讲spark中的join底层实现
15. 讲讲rdd,rdd的弹性是怎么理解的
16. spark内存计算你是怎么理解的
17. dateframe和rdd的区别,对操作的数据来说还有啥不同

手撕SQL
last_value+case when解决秒了

反问

面试官一直问,直到我不会再换个,不过面试官没板着脸,在笑,所以对我来说压力还好,不是特别大。

#面试问题记录#

全部评论
哪个部门
点赞 回复 分享
发布于 05-27 19:54 北京
接好运
点赞 回复 分享
发布于 05-24 16:39 河南

相关推荐

浏览器内核(Browser Engine)是指浏览器中负责解析和渲染网页内容的核心组件。 它是浏览器的关键部分,负责处理 HTML、CSS、JavaScript 等前端技术,将网页内容转换为可显示的图形界面。以下是一些常见的浏览器内核:https://www.nowcoder.com/issue/tutorial?zhuanlanId=Mg58Em&uuid=e603181d8a9b4b9ea0cc9be7cb8778b7Trident(也称为 MSHTML):Trident 内核是由微软开发的,用于 Internet Explorer 浏览器。它被用于自 Internet Explorer 4(1997 年)起的多个版本。Gecko:Gecko 内核是 Mozilla Foundation 开发的,用于 Firefox 浏览器以及其他使用 Mozilla 技术的应用。它被设计成高度灵活的内核。WebKit:WebKit 内核最初是由 Apple 开发的用于 Safari 浏览器。后来,Google 采用了 WebKit 作为 Chrome 浏览器的内核。它支持 HTML、CSS 和 JavaScript,还有一套高性能的渲染引擎。Blink:Blink 是由 Google 发起的一个分支,基于 WebKit。自 Chromium 项目内核改为 Blink 后,许多浏览器如 Chrome、Opera 和 Edge(Chromium 版)都使用了 Blink 内核。除了上述常见的浏览器内核,还有一些较小或基于开源项目的内核,例如 KHTML(Konqueror 浏览器的内核),EdgeHTML(旧版 Edge 浏览器的内核)和 Servo(由 Mozilla Research 开发的实验性内核)。需要注意的是,随着时间的推移,浏览器内核的技术和实现细节可能会有所变化,因此查阅相关资料以获取最新信息是明智的。
点赞 评论 收藏
分享
评论
6
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务