腾讯PCG-数据工程 一面

1.  简单介绍一下项目
2.  在中间层建设中遇到过什么问题
3.  数仓中状态的更新是比较及时的,如何记录这些状态,最核心是关心最终的状态还是流转的状态
4.  拉链表是什么,怎么实现的,执行过程中怎么解决效率的问题
5.  用的什么计算引擎,sql在spark上怎么执行的
6.  spark的提交流程
7.  uv和pv的含义,计算uv在spark上的运行原理
8.  MapReduce的原理,快排的目的是什么,有序的目的是什么,知道每个过程才能知道如何去调优
9.  sql转ast是怎么转的
10. ast做逻辑执行计划优化做了哪些
11. 逻辑执行计划和物理执行计划大概有什么区别
12. 写sql过程中有没有遇到过执行时间特别长的,引出数据倾斜相关内容(问的很细,基本所有的都问了)
13. 不同数据类型join为什么导致数据倾斜
14. mapjoin和正常join的区别,mapjoin原理是什么,怎么实现的
15. 加随机数打散,两阶段聚合怎么做的
16. new一个线程怎么做,thread和runnable的区别是什么
17. java集合类用过哪些(说没怎么用过java,就没再问了)
18. sql在不同执行引擎下有什么区别,答有些语法不通用,为什么不通用,如何造成这种问题的
19. sql中所有关键字的执行顺序
20. a join b where条件写在join里面和join外面 有什么区别
21. 4道sql
22. 一道mid算法

做的是计算引擎调优,一直在问spark底层,顶不住顶不住。
当晚挂...
全部评论
请问做完测试题等了多久才面试的?
点赞 回复 分享
发布于 03-09 11:44 河北
这个偏数据平台了么
点赞 回复 分享
发布于 03-07 13:19 北京

相关推荐

4月初面了腾讯二面,感觉尽力了,可惜没过,差不多5个小时显示流程结束项目:1.你介绍的两个项目有实际落地吗?还是学校实践项目?2.智能安防项目中使用的 RTSP 协议流程是怎样的?(客户端与服务端拉流过程)3.RTSP 与 RTP 的关系是什么?4.项目中提到在 100 兆带宽下降低 40% 网络丢包率,具体是如何实现的?有实测对比数据吗?5.除了 H.264 编码,还了解哪些流媒体编码格式?(如 H.265、H.266 等)6.除了 RTSP,还了解哪些媒体传输协议?(如 RTMP、HTTP-FLV、HLS 等)7.智能安防监控系统是如何拆解模块的?各模块功能和设计思路是什么?C++ 知识问题:8.C++ 中重载和重写的区别是什么?9.纯虚函数与虚函数的区别是什么?10.C++ 智能指针有哪些?它们的区别和适用场景是什么?11.互斥锁和自旋锁的区别是什么?性能差异和操作系统资源开销如何?网络协议问题:12.TCP 如何实现可靠传输?请说明其核心机制(如序号、确认号、滑动窗口、拥塞控制等)。13.TCP 拥塞控制的具体机制有哪些?慢启动、拥塞避免、快重传等如何运作?技术挑战与解决:14.在项目实践中遇到过哪些棘手问题?如何解决?(如多线程设计、责任链模式应用等)15.责任链模式在项目中的具体作用是什么?如何处理多线程并发和数据共享?算法题:16.给定一个数组和目标值 s,找到长度最小的连续子数组,使其和≥s。请说明思路并编写代码(滑动窗口法)。
腾讯二面1034人在聊 查看16道真题和解析
点赞 评论 收藏
分享
评论
7
21
分享

创作者周榜

更多
牛客网
牛客企业服务