7.23百度提前批二面结束!
一面(60-70 min,纯技术)
1. 自我介绍 + 项目 5-8 min
2. 手撕代码(现场 ACM 模式,无补全)
• 题 A:Top-K(数据规模 1e8,内存限制 512 MB)——先写堆排,再被追问如果单机内存只有 10 MB 怎么办
• 题 B:判断链表是否有环并返回环入口(LeetCode 142)
• 题 C:非递归先序遍历二叉树(要求 O(1) 空间)
3. 算法深挖
• 快排最坏退化场景 & 如何避免(三数取中 + 随机化)
• 链表与数组实现队列的复杂度对比
4. 计算机基础
• new / delete 与 malloc / free 的区别(从构造析构、异常、重载角度答)
• Linux 下查看进程占用内存的命令
5. 反问环节
================================================================
二面(50-60 min,项目+算法+场景)
1. 项目拷打(占 20 min)
• 项目中用到的多路召回如何构造负样本?
• 如果线上 CTR 突然掉 5%,如何排查?
2. 深度学习/机器学习基础
• 文本极度不平衡(1:1000)时的处理套路
• 评价指标:AUC vs F1 何时用哪个?
• L1/L2 正则化分别带来什么先验分布?(L1 拉普拉斯、L2 高斯)
• XGBoost 相比 GBDT 的三点核心改进(二阶导、正则项、缺失值处理)
3. 手撕代码(面试官现场给需求)
• 简化版 MaxPool1d:滑动窗口 k 输出最大值,要求 O(n)(单调队列)
• 二分查找递归/非递归各写一遍,并证明 log n 复杂度
4. 开放题
• 半监督文本分类只有 1% 标注,怎么迭代?
5. 反问环节
#提前批过来人的忠告##秋招提前批启动你开冲了吗#