百度提前批面经-大数据开发一面

首先想说面试官真的好!很善解人意,听出到菜鸡的紧张不停地安慰我
总时长大概一个小时
1.自我介绍。
2.python的lambda函数举例实现。
3.说说python内置的数据解构。
4.ACID。
5.撕项目,大概20多分钟。
6.你知道的排序算法有哪些,HR选了一个排序,说一下基本的算法思想。
7.是否用过索引,介绍一下你所了解的索引
8.(因为简历)java的熟悉程度如何。
9.窄依赖和宽依赖。
10.手撕SQL两道题,基础的比较简单,另外一道是行转列没写出来。但是HR很耐心的在引导我,让我说出思路就可以。
11.Spark是否接触过,如何实现简单的如worldcount功能
13.如果给你一段数据,怎么用你知道的语言进行处理数据
12.反问环节
    HR是什么部门,主要用什么技术栈
    大概多久拿到结果
    如果此次面试失利是否影响我的实习岗位投递?
    (听到这个问题面试官又在安慰我不要那么悲观,心里好暖
全部评论
后续呢?
点赞 回复 分享
发布于 2023-08-17 21:03 陕西
啊百度没问很难耶 我都没敢投
点赞 回复 分享
发布于 2023-08-05 08:00 江苏
不问hive吗
点赞 回复 分享
发布于 2023-08-03 19:34 山东
base 北京还是深圳
点赞 回复 分享
发布于 2023-07-25 17:34 广东
佬是哪个部门啊
点赞 回复 分享
发布于 2023-07-25 15:24 陕西
老哥,sql题目很差在哪里刷比较好?
点赞 回复 分享
发布于 2023-07-25 14:29 上海
牛哇,看到的第一个百度大数据面试的,带带我😭
点赞 回复 分享
发布于 2023-07-25 10:46 浙江

相关推荐

一面(4-7):--大数据相关内容--    拷打用SparkSQL迭代计算的合作项目(常规问题:如你负责哪一部分,做什么内容,难点是什么,价值点在哪里)    Spark和MR区别    Spark宽窄依赖,DAG流程图    Spark和Hive对数据倾斜的处理    Hadoop指的是什么(狭义,广义上来答)    你还用过哪些大数据组件(sqoop,presto,zookeeper)    sqoop用来做什么    presto和Spark的区别是什么    zookeeper干什么用(高可用,不过我只知道理论基础,这一块实操我不负责)    维度建模和范式建模的区别(面向分析和面向事务,一个为了分析可以接受冗余,另一个则尽量拆分表直到没有冗余)    --之后就偏离大数据,侧重于基础知识的考察--    数据库的索引(不会,g)    数据库设计一个图书管理系统,用范式建模理论,要有哪些表和字段(很久之前的课设,所以答得很一般)    http和https(久远的知识,只答了一个后者比前者更安全)    tcp三次握手(有点印象,草草讲了一下)    tcp和udp区别(大二学的,忘完了,g)    数组和链表(简单讲了一下存储地址与增删改查的时间复杂度)--算法--    二分查找(ez)    --sql--    1.统计每个用户每天每种支付方式的总金额(没有数据,只有字段,愣了一下之后解决了)        user_id        pay_method(有两种支付方式)        date        count    2.连续三天登录(sql中经典的难题,但做法死板,多做几遍就会了)--面试官解释--    实习侧重综合能力,所以问了很多大数据之外的内容,这点和秋招有一定差别二面(4-9):--大数据相关内容--    拷打数仓构建的学习项目    数据仓库为什么分层    数据仓库怎么分层(结合项目讲)    数据仓库分层后每一层的作用(结合项目讲)    缓慢渐变维怎么处理(SCD1,SCD2,SCD3)    SCD2好处,弊端(保留历史数据的同时更新数据,数据冗余比较多(但面试官一直追问还有吗....榨不出来了啊))    拉链表具体怎么做,end_date有什么用    hql怎么翻译成MR程序的(偷面经背了一下)    MR流程详解(看过好多版本的MR流程,挑了一个背了)    select ... from t1 join t2 group by ...  这个SQL执行,要运行几个MR(不会,跟面试官说是两个)    如果用了map join,上面的SQL运行几个MR(不会,跟面试官说是一个(因为mapjoin不用shuffle))    (这个问题后来研究应该都是跑两个MR,但是mapjoin实践检验太麻烦了,就没深究了)--其余知识--    现在我们正在进行的视频通话,用到哪些网络传输协议(一面结束把tcp和udp区别背了一下,于是乎答了个udp)    大学期间还学了那些课(就怕说漏嘴了后考我陈年老课)    读过哪些大数据相关书籍(大数据之路,还有一些阿里开发的规范文档)--算法--        大数相加(输入是很长的数字字符串)   --sql--    统计每天城市消费占比前十的用户和他们消费占区域总消费的多少(猪脑过载,逆天了)    用户表:        user_id        city_id        date        product_id        count    区域表        city_id        area_namehr面(4-14): --常规问题--    为什么放弃深造    你对在北京工作的看法    职业规划    你给你前两轮面试打几分,为什么    你为面试字节做了什么准备    你对我们部门了解多少    没有工作经验,怎么适应公司业务    工作后你要怎么尽快适应环境oc(4-17)--------------------------------------面经到此为止,后面是一些求职感想----------------------------------------------------历程--求职本就是一个运气和实力交织的过程,这次面试凭借自身发挥和一定运气拿下offer了,但3-4月背后也有很多失败腾讯面五挂四(传奇耐挂王)    京东面二挂二    百度挂    美团挂    快手挂    字节hr面挂(挂了之后复活赛打赢了)阿里系(阿里云,携程,陶天,饿了么等)万兴,360 ...  笔试就挂了...往好的方向想,做最坏的打算。该干嘛干嘛就可以了,太注重失败就没心思学习了(而且很多kpi面没必要内耗)。希望每个人都可以得到心仪的工作,希望努力的人都有光明的未来
平常心Oct:最后一段话说的太好了
点赞 评论 收藏
分享
04-20 18:42
已编辑
门头沟学院 Java
后端一面3.19待记录。。。后端二面3.211.ai写一个js脚本2.场景题数开一面4.21. 怎么用布隆过滤器解决缓存穿透的问题2.布隆过滤器不能删除的话,那么假设现在有个场景是需要对访问的数据进行一个删除,那么要怎么设计3. redisson怎么实现分布式锁4.项目5.HashMap的扩容机制6.锁升级7. mysql事务的隔离级别以及其实现8. bitmap怎么实现用户签到功能9. bitmap保存每个用户当前月的签到情况的话,在用户量很大的情况下可能会导致内存占用过多,有没有什么解决的好办法10.在用户量不大的情况下,将所有用户签到存在一个bitmap中怎么实现手撕:k个一组反转链表数开二面4.8:1. Java基本数据类型2. 讲一下在项目工程中使用long的例子3. 用过byte吗4. 介绍一下什么是多态5. 介绍一下深拷贝和浅拷贝的区别6. 在工程中是如何实现深拷贝的7. 讲一讲什么是函数式接口8. 使用过lambda表达式吗9. 什么是事务10. 事务的四大特性11. 在工程中是如何实现事务的12. Spring框架有两个IoC容器能介绍下吗13. 能不能介绍一下什么是动态代理14. 之前有用过动态代理写过一些东西吗15.项目16. 当你的系统出了问题的时候,作为一个研发,你是怎么了解到你的系统出了问题17. 你系统中的日志都存在哪个地方18. 用过哪些消息队列,怎么选型的19. redis有哪些数据结构20. 缓存三剑客的含义和解决方案21. 能不能介绍一下在工程中用到的一些比较好用的提效的工具或者插件22. 介绍一下你在学习或者开发工程中遇到的比较困难的事情23. 最近有学习一些新的东西吗24. 受到同学或者老师最严厉的批评是什么25. 分享一个印象最深刻的周围人让你最不舒服的经历
点赞 评论 收藏
分享
评论
4
42
分享

创作者周榜

更多
牛客网
牛客企业服务