字节data 后端开发工程师提前批一二面 面经

😅😅三面已经挂掉了,有兄弟找我要一二面面经。 HR说data 大数据开发工程师 会捞一下我。因此,来回忆一下前两面的内容,后续如果能被捞继续复习。

一面:一小时

spark 实时处理项目挖掘。

  1. 讲一下双流join?双流join 是事实表和维度表还是事实表和事实表join?
  2. Redis 主要是用来干什么的?

实验室项目挖掘。

  1. 介绍下无人车项目
  2. 介绍下Apollo OpenDRIVE 格式这里是用来干啥的,给下游导航模块提供数据的。
  3. 说一下实验环境,在哪的10公里?

两道题目手撕:

从左下角到右上角的路径个数

  1. dp写出来
  2. 用排列组合的方式会不会计算,分析分析

翻转二叉树

二面:一小时十分钟

项目介绍:

  1. 介绍一下自己一个做得好的项目。
  2. 说一下这里面难点在哪?我讲了双流join。
  3. 面试官反问如果存储的时候Redis 数据量过大咋解决的?这个问题在快手也被问到了 😱😱😱 大家知道怎么回答这个问题吗?能不能告知一下

网络:

  1. TCP 和 UDP 的区别?
    答了可靠和不可靠,答了应用场景。
  2. TCP 是怎么实现可靠性的?
    答了:ACK机制,三次握手四次挥手,流量控制,拥塞控制。没有继续追问。
  3. 为啥需要三次握手和四次挥手?
    为了保证全双工。发送方和接收方都有发送和接受的能力。没有继续追问。
  4. IP 地址和 MAC 地址的区别说一下?
    IP 是网络层,MAC是数据链路层。IP可以来做路由转发,MAC主要是ARP点对点发送。
  5. 只用MAC 地址不用IP 地址行不行?
    我说了IP可以有子网还有网段MAC不行。还有不在一个协议层。面试官说MAC地址不够?存不了这么大的范围?😥😥这个不会

数据库:

说一下事务,说一下ACID是怎么保证的。

操作系统:

说一下进程和线程的区别

算法:

写LRU cache,自己编写测试用例测试。

大数据基础:

  1. Hadoop 有哪几部分构成?MR,YARN,HDFS
  2. Hadoop 主要有哪些进程说说?NN,standByNN,ZKFailoverController,DN

反问:

  1. 部门技术难点?说难点主要在于业务的理解。
  2. 技术栈是啥?Spark 离线,Flink 实时。
  3. 发展方向?在实现流批一体?数据和计算分离?数据湖?

总结:

项目中存储的时候Redis 数据量过大咋解决的?有人知道这个问题怎么回答吗?能不能在评论区贴一下答案,谢谢!

#字节跳动##大数据开发工程师##秋招#
全部评论
路径那个排列组合,就是一共走m+n步,其中m步向下,n步向右,相当于从
点赞 回复 分享
发布于 2022-08-26 00:34 四川
因为MAC地址太多了,种类也多,直接找MAC地址不现实,都是先找到同一片局域网内在进行ARP寻址
点赞 回复 分享
发布于 2022-09-03 15:11 广东
数据量过大其实都可以从两方面回答,第一就是从实际业务逻辑去分析,第二就是存储配置的调优,redis是基于内存的,如果是集群配置下,内存足够,基本上没啥性能问题
4 回复 分享
发布于 2022-08-25 22:05 台湾
redis设置过期策略就行
点赞 回复 分享
发布于 2022-09-01 00:23 北京
二面过了吗
点赞 回复 分享
发布于 2022-08-27 13:20 北京

相关推荐

05-20 13:59
门头沟学院 Java
米黑子米黑子:你这个成绩不争取下保研?
点赞 评论 收藏
分享
葬爱~冷少:我当时都是上午刷力扣,下午背八股,有活给我先别急,没活就干自己的事情
点赞 评论 收藏
分享
评论
7
42
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务