百度_数开实习_一面

- 大数据平台研发岗位
- 如流软件面试,开摄像头,在如流上手撕代码
- 面试官人很好,经常鼓励人,也会及时给出正确的思路
- 可惜职责还是有点不匹配,这个部门主要用java和go做平台的开发,类似DolphinScheduler的平台开发

## 八股

- 对DolphinScheduler的底层代码和架构有没有了解
- 你在Spark你在用的过程中,有时候会碰像那种性能不好或者数据倾斜的场景。这种情况下你一般会怎么去做优化?可以就结合你具体遇到的问题,可以来来详细讲一下,就是或者hive遇到的都可以。
- 你在这过程中,就你项目中接触了这么多个组件,有没有自己去搭过一些集群和组件相关的呢?
  - 搭建过程中有没有碰到过,比如什么问题,比如HDFS不可以用,或者是Yarn出问题,这种问题有没有碰到过?
- 你对于Hadoop他这边是如何实现这种高可用有了解吗?
  - Zookeeper是作为分布式锁存在的
- HA高可用中多个NN数据是一样的,他们是怎么保证数据相同的
  - HA高可用中还有什么Node,通过日志的形式保证多个NN的数据一致
- 主要开发环境是linux还是windows
- 对linux这边有一些基本的了解吗?
- 比如我linux有一台有一个linux它有一就是linux他你通过你那个发现他的内存或者CPU占用特别高,它中间可能是某一个进程或者某一个服务占用了大量资源。你这种情况下,你如果是你的话,你怎么去排查?
- 比如我有一个任务,他你比如说他发现他的日志一直在写,就是一直在打那个没有空间了,就没有磁盘空间了。这种情况下你怎么去查一下是哪些地方磁盘不足了,应该怎么处理?
- java中equal和==的区别
  - 自己写过自定义类重写equals方法吗
- java类加载的这块你了解过吗?
  - 讲了双亲委派机制
  - 为什么要实现双亲委派机制这个操作?
- java反射了解吗
- java多线程代码写得多吗
  - java线程有几种状态
  - java中如何写代码多线程访问共享资源

## 手撕

- 手撕LRU类,要求实现get和put方法,并且规定一个最大容量,如果put时达到最大容量则替换掉存在最久的元素
  - 讲思路,用的事务id,很快实现了
- 手撕java多线程代码,被我婉拒,实在不怎么记得了
全部评论
数据平台吧,不像是数仓的问题啊
1 回复 分享
发布于 03-14 23:32 安徽

相关推荐

1. 基本情况方向:数据工程,时间:40分钟结束、16:00开始,无手撕,多场景2. 自我介绍3. 一些能够回忆起来的(或许有不正确的地方):(1)提问R:你这个项目是课程作业还是什么?R:那你说说Hive和ClickHouseR:你谈到了OLAP,那和OLTP有啥区别?R:没了?ClickHouse适合那种场景?R:可以用作实时数仓吗?R:课程中有数据库相关的吗?只有数据结构与算法?R:MySQL系统学习过吗?R:数据怎么导入到ClickHouse的?R:直接到ClickHouse?R:数仓分层?四层讲讲。R:那为什么要分层呢?DWS已经差不多了为什么还需要ADS呢?R:场景题:在你的表上新...
牛客861513826号:A场景题:数量统计不说了;退货平均时间:先沟通清楚,月平均退货时间算不算上不退货的用户,不算的话,就只计算退货用户;一个用户的退货时间减去到货时间拿到这件商品的退货时间,然后计算每个退货用户的退货时间,AVG开窗partition by月份,计算出每个月的平均退货时间。如果要算上不退货的用户,也就是让这个用户的退货时间是0,然后对所有用户计算AVG同上。 B场景题:结合下面他提示你再想想数据倾斜,其实这道题是想靠你数据倾斜怎么解决;本来是一个商品购买信息表,记录商品信息和购买者信息,如果给购买者信息加上性别,要求算出每个商品不同性别的购买人数。百分之八十女性用户,所以如果单纯对表进行分组聚合,会产生数据倾斜问题,由分组聚合产生。五种办法可以解决,两种hive参数,三种SQL,往SQL方向聊,以防他追问参数底层,参数这种东西最难聊了,别给自己挖坑
点赞 评论 收藏
分享
2月: 字节(温柔的拷打)知识点没说全 (计网多)3月: tx 1面 go语言 答了70-80% 感觉还不错 应该是没达到面试官的标准 面试官很不错 我没答上的全部给我讲了百度1面 golang面试官迟到了 5分钟 问的问题也很偏 但基本回答了7788 题也做出来了, 我以为挂了 但面试官给过了Pdd一面 手撕g  百度2面 时至今日都让我懊悔的一场面试,是我离大厂最近的一次,开始面试官说听不清我的声音让 我先做两道题 中途有点卡壳 但幸运的是都做出来了 面试官的问题也回答上来 随后面试官主动介绍业务背景和组内的事情  这场面试我本以为我过了 但是想着有两个问题没问好 一个就是反问没有问标准的两个问题 而是自顾自的问题了一个ai的看法,还有一个是面试官问我手里有offer没 我说了没有 应该感觉就是挂掉了(也可能是排序挂,反正官网有问题看不到流程),我老是在想是不是表现得在积极一点 可能就给过了呢。 这次面试卡了我很久导致我之后的面试也没好好准备,因为也不知道挂没 在等结果 等了一个星期 再加上 4天的清明假期。4月:阿里一面 java面的很差,很多基础知识忘记了 导致面试官没什么想的了 还问了一个transform的多头注意力机制 不懂 面试官水平很高。腾讯 teg 面试官很好 项目有个细节给拷打住了 g 饿了么 八股 场景轰炸 1h 三天后挂 感觉是排序挂 问的挺有难度的马上消费 硬控面试官 当场oc 小厂不提也罢Kook 两道场景题 很有意思  拒二面腾讯 三面 巨离谱的面试官压力拉满 手撕也做了 问题也答了 不说话是什么鬼。差评到现在感觉已经有点身心疲惫了 很久没有面试了。 我该何去何从
点赞 评论 收藏
分享
评论
3
12
分享

创作者周榜

更多
牛客网
牛客企业服务