百度搜索架构工程师一二面凉经
京东校招内推码: C4K4D
提前批投的大数据开发岗位,共享到搜索架构工程师,面试官介绍是做最底层的数据处理、建索引、流式计算等,技术栈主要是c++。
一面(40min):
离线数仓:项目介绍、整体流程、hdfs存储策略、时间尺度
操作系统:进程和线程
计算机网络:TCP和UDP区别、TCP如何保证可靠传输
Python:list和tuple区别、深拷贝和浅拷贝
算法题:链表删除指定位置的节点
sql:学生表(id,class_id, score),输出每个班级成绩排名第一的学生id;
二面(1h):
写两个mapreduce程序:
1. 给定一系列文本文件,文件中每行是一个ip,求出访问频率最高的1000个ip
2. 1000亿数据和100亿数据求交集
离线数仓项目数据采集使用的工具,flume和maxwell
kafka在项目中的使用
mapreduce过程
flink数据防丢、防重通过什么方式来保证
flink和spark流式处理的区别
线程同步是怎么实现的(答了锁,面试官问了不了解信号)
网络编程(socket)了解吗(不了解)
算法二叉树层序遍历,输出格式为:行号: 该行对应的各个元素,空节点输出null
二面mapreduce程序写不出来,太生疏了;其次感觉技术栈和岗位上也有些不太匹配,操作系统相关基础还是得再看看。
下一家继续加油。
提前批投的大数据开发岗位,共享到搜索架构工程师,面试官介绍是做最底层的数据处理、建索引、流式计算等,技术栈主要是c++。
一面(40min):
离线数仓:项目介绍、整体流程、hdfs存储策略、时间尺度
操作系统:进程和线程
计算机网络:TCP和UDP区别、TCP如何保证可靠传输
Python:list和tuple区别、深拷贝和浅拷贝
算法题:链表删除指定位置的节点
sql:学生表(id,class_id, score),输出每个班级成绩排名第一的学生id;
二面(1h):
写两个mapreduce程序:
1. 给定一系列文本文件,文件中每行是一个ip,求出访问频率最高的1000个ip
2. 1000亿数据和100亿数据求交集
离线数仓项目数据采集使用的工具,flume和maxwell
kafka在项目中的使用
mapreduce过程
flink数据防丢、防重通过什么方式来保证
flink和spark流式处理的区别
线程同步是怎么实现的(答了锁,面试官问了不了解信号)
网络编程(socket)了解吗(不了解)
算法二叉树层序遍历,输出格式为:行号: 该行对应的各个元素,空节点输出null
二面mapreduce程序写不出来,太生疏了;其次感觉技术栈和岗位上也有些不太匹配,操作系统相关基础还是得再看看。
下一家继续加油。
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享

点赞 评论 收藏
分享