京东校招内推码: C4K4D提前批投的大数据开发岗位,共享到搜索架构工程师,面试官介绍是做最底层的数据处理、建索引、流式计算等,技术栈主要是c++。一面(40min):离线数仓:项目介绍、整体流程、hdfs存储策略、时间尺度操作系统:进程和线程计算机网络:TCP和UDP区别、TCP如何保证可靠传输Python:list和tuple区别、深拷贝和浅拷贝算法题:链表删除指定位置的节点sql:学生表(id,class_id, score),输出每个班级成绩排名第一的学生id;二面(1h):写两个mapreduce程序:1. 给定一系列文本文件,文件中每行是一个ip,求出访问频率最高的1000个ip2. 1000亿数据和100亿数据求交集离线数仓项目数据采集使用的工具,flume和maxwellkafka在项目中的使用mapreduce过程flink数据防丢、防重通过什么方式来保证flink和spark流式处理的区别线程同步是怎么实现的(答了锁,面试官问了不了解信号)网络编程(socket)了解吗(不了解)算法二叉树层序遍历,输出格式为:行号: 该行对应的各个元素,空节点输出null二面mapreduce程序写不出来,太生疏了;其次感觉技术栈和岗位上也有些不太匹配,操作系统相关基础还是得再看看。下一家继续加油。