首页 / 算法岗面试

#

算法岗面试

#

33213次浏览 421人互动

此刻你想和大家分享什么

热门最新

08-25 20:14

门头沟学院算法工程师

字节大模型一面

📍面试公司：抖音💻面试岗位：大模型算法❓面试问题：1. 拷打实习，问了很多很详细的数据和做强化学习的motivation2. 八股拷打（好久没看基础机器学习了都忘了）介绍一下优化器的发展现在大模型的优化器是什么ln和bn的区别encoder-only和decoder-only区别以及应用场景qkv具体是什么为什么是多头注意力上下文长度是什么，有什么作用lora和全参区别欠拟合和过拟合具体要怎么办3. 手撕一个复杂度o(1)的插入删除和随机等概率返回（最近怎么遇不到hot100了）🙌面试感想：面试官人很好业务也很好玩，可惜了我手撕写了好久好久还磕磕巴巴

查看11道真题和解析

点赞评论收藏

分享

08-25 20:22

门头沟学院算法工程师

秋招挂挂挂挂到厌倦

截止8.25，投了30家，有互联网大厂也有制造业。一到周末全是笔试，明确挂了四家，还有一堆在等着筛选，一部分在面试流程，附上投递记录可供参考滴滴饿了么快手小红书招商银行拼多多科大讯飞虾皮联想阿里菜鸟阿里云中国人保TPLINk普联百度提前批B站vivo美团小鹏汽车淘天阿里国际蚂蚁字节高德地图美的

独角兽内推__免笔试：同学，瞅瞅我司，医疗独角兽，校招刚开，名额有限，先到先得，我的主页最新动态，绿灯直达，免笔试～

点赞评论收藏

分享

05-18 20:42

中山大学算法工程师

211本硕腾讯大模型算法岗面经

#简历中的项目经历要怎么写# #大模型# #互联网大厂招聘# #算法岗面试# #大模型面经#

腾讯二面1089人在聊

点赞评论收藏

分享

09-27 21:05

已编辑

中山大学算法工程师

26届校招｜快手大模型应用算法面经

▶️一面 🚤时长约50min1．自我介绍。2．拷打了一下项目和论文。3．为什么多头注意力能提升表达能力？4．为什么要在大模型中使用 RMSNorm ？和 LayerNorm 有什么差异？5．KV Cache 是怎么起作用的？为什么对长上下文推理很关键？6．大模型推理时的加速思路？7．模型微调时遇到过过拟合吗？怎么处理的？8．✨算法题手撕：1️⃣字符串的全排列2️⃣二叉树序列化与反序列化▶️二面🚤时长约40min1．自我介绍，深挖简历。2．深挖项目，针对项目思路不断追问。3．大模型生成内容如何做去重过滤？4．如果词表特别大（10w+ token ), Softmax 加速通常有哪些实现？5．如果要在中文领域做Instruction Tuning ，需要注意哪些数据问题？6．LoRA 和 Prompt Tuning 有何区别，分别适于什么场景？7．反问。📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看15道真题和解析

点赞评论收藏

分享

03-20 17:04

门头沟学院算法工程师

快手-多模态大模型实习生-一面可灵视频生成团队

情况: √ 一面结束没多久就反馈了大概1个小时不到1、为什么大模型会出现复读机现象2、从Transformer介绍大模型的前世今生3、请介绍你的论文和实习的项目4、为什么使用多头注意力5、sft过后的模型提取不了prompt，视而不见，能不能通过cot来缓解(推理速度变慢)6、leetcode-最长回文子串基本都是简历面反问:1、具体是干嘛的沿着可灵团队的多模态，做一些多模态的理解，也是业务导向的发论文和出成果

查看7道真题和解析

点赞评论收藏

分享

04-27 12:27

中山大学算法工程师

算法求职简历该怎么写大模型微调

结合最近辅助修改的简历及项目，老师总结了部分大模型微调简历的踩雷点。🙅‍♂️错误示范：在 x任务中，获取 xxx 条数据，通过规则 or 脚本清洗出 x 条数据，然后微调 y 大模型，在业务上提升 x 个点。✍🏻原因:大模型微调的平台是现成的，基模是现成的，体现不出核心能力。✅应该怎么写？首先介绍业务背景：业务是一个销售对话业务，机器人是销售，代替真人，直接面对用户。我们会给模型设定任务，任务是 prompt 。步骤1️⃣．提取训练数据问题：1.真人通话每通电话任务是未知的，我们训练数据是任务＋通话的 pair 对。2.真人通话很乱，与客户的对话是各种交叉的，导致 asr 后并不是一人一轮。解决方案：1.首先通过大模型 prompt 对该通电话提取任务，得到任务＋ pair 对。需要用到 cot + reflection ＋多 Ilm 一致性+ debating 的模式。2.使用大模型根据以上任务和真人对话，让大模型编写出通话内容。提问，为什么要编写而不是直接用？步骤2️⃣．制定训练数据集问题：1、正常的对话内容，前面几句和后面几句基本上一致的。都是问候和拜拜，但是也有一些差异。2、因为都是相似场景，虽然任务不同，但是很多场景语义很相似。解决方案：1、基于轮次的权重采样：通过轮次设定权重进行 weighting sample 。解决问候和拜拜的高占比问题。2、基于语义的采样：使用 bert 对对话内容进行 embedding ，然后使用层次聚类通过调节阈值聚类出相似语义的类。对一个类里的样本进行随机采样，提问，为什么要对重复语义的数据进行下采样？3、基于客户类型和产品的采样，因为很多产品是热品，导致对话内容有偏，用户类型一样，需按照类型调整整体比例采样。提问，为什么要这么采样？步骤3️⃣．制定训练数据集我们直接把输出当作 target 进行训练。使用的 lora 训练，但是 lora alpha 设定成为4倍的时候达到了比较好的效果，经验值不同任务不一样，提问，在各种情况下要怎么调？步骤4️⃣.dpo训练问题：v1版本训练时，很多输出内容是对的，但是输出的语气不太像真人，机器人味还是很严重。解决方案：由于训练本身是有 ground truth 的，因此使用v1训练的模型，预测训练集，使用大模型对比两者语气不符合训练集的拿出来，使用训练集的 ground truth 和模型的预测数据作为 dpo 训练对，对v1版本模型重新训练。📳这里老师只是简要进行概括解答，具体情况和详细解答可以咨询辅导，如果想了解项目辅导，提升面试能力，欢迎后台联系。

点赞评论收藏

分享

04-14 22:33

已编辑

卡内基·梅隆大学数据分析师

美的-NLP/大模型一面面经

📍面试公司：美的👜面试岗位：NLP/大模型📖面试问题：1. 介绍bert2. 因项目中用到了bert+crf，问了两者用到学习率是否一样？为什么不一样？3. crf的转移矩阵和发射矩阵是什么？计算公式和计算结果是什么？4. 大模型微调怎么做的？5. Qwen的位置编码是怎么做的（rope和YaRN）6. rope是加上去的还是乘上去的？bert的呢7. rope是怎么应用在超出长度限制的输入上的，bert的位置编码可以用到超出长度限制的输入上吗8. 如果大模型输入是4k长度，可以输出8k的长度输出吗9. lora可以用在哪些地方？为什么可以用在ffn层？为什么作者一开始先用在q,k,v,o的权重矩阵上？10. 如何理解低秩状态？11. 在资源受限制的情况下（不能分布式），有10亿条数据，原本需要训练10亿次，怎么做能够减少训练次数，比如训练6-7亿次？这题不太明白，只回答了一个梯度累积其他是一些项目问题反问：业务内容，岗位能力交叉性🙌面试体验：已经无力，攒攒人品

查看11道真题和解析

点赞评论收藏

分享

05-12 07:39

中山大学算法工程师

如何拿到大厂算法岗offer

大厂算法岗面试官帮你规划学习路线✴️今天给大家梳理一下：算法岗求职过程中关键的影响因素，希望能帮助同学们达到算法岗的要求。0️⃣学历：硕士以及以上。一般来讲，学校层次在985/QS前200尤佳。简历非常优秀的211/双非硕士也有机会。1️⃣初期准备：要有python和深度学习/机器学习基础，其中针对关键的模型（CNN/RNN/Transformer/VIT/Bert/GAN等），要熟悉原理以及能进行模型训练/测试。2️⃣方向选择：从目前热门的方向，比如大语言模型，多模态大模型，AIGC图像生成，搜广推中选择未来的发展方向，这些方向更容易拿到大厂算法offer。3️⃣简历：重点突出对口且有质量的项目经历，以及实习经历，这个是决定是否能够脱颖而出的关键。这一部分如果缺少，可以后台咨询补充经历。4️⃣面试能力：（1）体现在能否给面试官有逻辑的体现自己过往的经历，比如有质量的项目/实习经历。（2）对算法领域有足够的了解，更多体现在对新方法的跟进以及经典方法的理解。5️⃣代码：leetcode top 100分类别去刷，包括数组，链表，矩阵运算，动态规划等等，以及经典网络代码，比如MHSA，LN等。🍁如果想进一步了解如何规划学习路线，提升简历和面试能力，欢迎后台咨询。

点赞评论收藏

分享

06-12 17:45

河北科技大学嵌入式工程师

211博士图像处理方向如何求职？算法开发？嵌入式部署？

现在211博一，本硕皆是双非，专业不是计算机的，非科班，研究方向是图像处理（就是人很多且很卷的CV方向），自我有认知干不过科班的大佬。现在有点迷茫，望前辈给点经验。心仪工作方向一：走算法开发方向？投图像处理算法岗，但是这岗位竞争激烈，代码要求又高，听说又卡学历。。。目前看不到任何希望心仪工作方向二：走算法部署方向，嵌入式开发（软件还是硬件？），C++部署，算法移植之类的，不知道未来几年竞争大不大？这方向需要学习什么？？

点赞评论收藏

分享

03-27 13:48

已编辑

门头沟学院算法工程师

哔哩哔哩算法

先介绍了部门业务，主要工作内容然后讲简历里的论文，面试官问的很细，包括论文背景，输入输出，idea怎么来，包括有些没理解清楚的会进一步确认。项目里用到的qwen，讲一下qwen结构qwen-VL的三个训练过程多模态llm实现方法有哪些，讨论一下几种方案好坏做题：二叉树层序遍历然后闲聊：有没有尝试微调大模型，有什么调参经验（本人实在没啥好的经验，就随便瞎扯了一些，面试官也说没关系）plus：b站面试官态度真好，面试感觉更像是一个探讨技术的过程，说的不清楚的地方也会继续引导，体验真不戳

查看8道真题和解析

点赞评论收藏

分享

05-09 19:12

中山大学算法工程师

推荐算法3轮面经

今天老师给大家分享推荐算法3轮面经，供各位同学参考。1️⃣第一轮1、先自我介绍，我的习惯是经历简单介绍一下，然后自然转向准备最充分的一个项目开始详细讲，面试官感兴趣的话最好，不感兴趣的话会直接打断的。主要介绍了项目的背景，难点和解决方案，面试官关心的点主要集中在问题抽象和损失函数，讲清楚为什么这么做，项目大概聊了半小时左右2、机器学习基础：推导 lr，写出loss和梯度（比起推导svm来说简直就是送分题，要是写不出来的话估计会直接挂，基础还是要好好准备）3、算法 链表对折 1 2 3 4 5 变成 1 5 2 4 3拆解一下题目，(灵活)找到链表的中点 牛客题霸: 链表中倒数第k个节点 是找中点的复杂版，都是双指针解法翻转后半段链表 牛客题霸: 翻转链表合并两个链表 牛客题霸: 合并两个有序链表 是复杂版2️⃣第二轮1、先介绍项目，主要聊了项目背景和收益，收益具体怎么衡量，项目如何上线生效2、算法题 m*n的二维数组，只能往右或者往下，找最短路径，n空间 牛客题霸: 矩阵的最小路径和3、有了解过设计模式吗？(答了常见的工厂模式和单例模式，对应的应用场景，简单扯了一下装饰器模式，也是看xgb源码看到的，其实不会用)4、系统设计需要注意什么，如何设计一个系统，系统性能如何评估，需要考虑哪些指标（考察点应该是线上的系统了，指标比如内存使用率，qps，99 39 49时间之类的）5、之前帮阿里云录制过一些深度学习的入门课程，简单聊了一下相关的内容3️⃣第三轮1、先介绍项目，主要聊了项目背景和收益，收益具体怎么衡量，项目如何上线生效2、介绍xgbgbdt和xgb的区别(居然没有问lgb)怎么选最优分裂节点，怎么加速，预排序有什么作用，怎么分箱，等宽还是等深怎么处理缺失值的，预测时候缺失值怎么办3、为什么离职，希望一份什么样的工作4、有没有什么问题想要了解的（问了业务场景 工作内容）📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看10道真题和解析

点赞评论收藏

分享

03-16 18:07

浙江大学算法工程师

cs本硕25届秋招回忆（含互联网/泛体制/选调）（上）暑期实习篇

bg：本人2025届应届，双9 CS科班，拿下涵盖互联网大厂ssp、制造业、银行、选调、人才引进等10+offer。分享自己贯穿着改方向、写论文、秋招的焦虑八爪鱼找工记录。时间线2月 ：前期轻敌，刷题八股这时候虽然心里有点焦虑但总的来说还比较乐观，认为自己主投大厂算法+银行总行，过年期间简单过了遍算法类八股，leetcode hot100。这里有一个大坑，就是算法类的八股十分零散，无法系统准备，跟你个人的简历和科研经历高度相关。（是我后续准备开发类内容的时候才发现开发的八股已经成熟的可以出书了）3-5月初：暑期找工，市场鞭打，方向调整前段：主投大厂算法岗+银行科技与管培2月底开始，各大厂就陆续...

点赞评论收藏

分享

04-20 20:16

武汉大学算法工程师

暑期实习快手推荐算法二面面经

4.11号约的一面，横向三天16号约的18号二面，二面表现有欠缺，各位佬看看我能不能进三面。1、拷打项目。项目是关于CV的，面试官没有这方面经验，但是会一直细问项目的细节，让我一步一步地讲解给他，他全部理解了才会下一个问题，虽然问的都不深，但是问的很细，基本都回答上来。2、问机器学习的八股文。逻辑回归、线性回归、归一化、正则化。正则化回答的不太好，L1稀疏化的原因没答好。3、Transformer八股文。encoder、decoder、layer Normal和Batch Normal等，就是基础的Transformer细节。4、推荐系统八股文。问了解多少，因为我是CV的，所以了解没有很多，讲了讲基本的流程，粗排和精排。问知不知道精排的深度学习的模型，我没太了解过，说了个MMoE。5、手撕简单，就是个排序。但是一个字母写错了，面试官要求运行，调试了两三分钟发现一个字母写错了。这还有希望能进三面么。因为手撕很简单一个题，结果写错一个代码。面试官一直在安慰我说有点自信，手撕其实没有那么重要，一直在安慰我。（快手的面试官真的very好）这还有希望能进三面嘛，好痛苦啊，很想去手子

查看10道真题和解析

点赞评论收藏

分享

07-01 13:25

中山大学算法工程师

有点狼狈:抖音推荐算法一二面😮‍💨

✅第一轮 抖音推荐算法一面✴️1、项目问了一下快手的工作2、八股介绍一下MMOE,极化现象知道吗，如何解决？L1和L2的区别介绍一下bn过拟合还有什么其他方法3、code最大子数组和链表交替打印4、反问业务是图文推荐，据说老板很重视，冲冲冲✅第二轮抖音推荐算法二面✴️1、项目介绍了一下快手实习，很深入探讨2、code隐马尔可夫模型，牛逼我只能说给定PI, Q, P矩阵，玩N次游戏，求N次游戏得到的R的概率刚开始说了个暴力解，然后在面试官提醒下，弄出来个DP算法，非常考验数学和DP的理解3、八股Adam的公式，额外的开销AUC定义，AUC如何计算，如何优化介绍一下self-attention📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

点赞评论收藏

分享

04-02 21:01

已编辑

浙江大学 Java

文远知行算法岗实习（感知方向）面经全解析与深度复盘

一、面试流程与核心要点1. 笔试环节题型：4道编程题（动态规划+图遍历为主），中等难度。典型题目：零钱兑换变种（动态规划）、图的最短路径优化（Dijkstra或A*算法）。备考建议：重点突破背包问题（完全背包、多重背包）及几何算法（线段相交、多边形包含判断）。熟悉LeetCode高频题（如跳跃游戏、NMS实现），注重边界条件与代码鲁棒性。2. 技术面深度剖析(1) 算法与系统设计考核零钱兑换变种：核心思路：动态规划（DP）状态转移方程，需考虑滚动数组优化降低空间复杂度至O(n)。进阶追问：输出所有组合时，可结合回溯+剪枝策略，避免重复计算。线段交点算法：参数方程法需处理分母为零（平行/重合）及浮点精度误差（如EPSILON阈值判断）。参考：文远知行面试中频繁出现几何类题目，需掌握向量叉积、快速排斥实验等数学工具。系统设计（shared_ptr实现）：关键点：引用计数的线程安全（atomic或mutex）、拷贝构造的深拷贝逻辑。性能对比：atomic操作轻量但依赖硬件支持，mutex更通用但存在锁竞争开销。(2) 项目深挖与技术追问点云处理中的循环推断问题：问题本质：目标检测（OD）与跟踪模块的误差累积，导致预测与观测矛盾。解决方案：引入卡尔曼滤波先验估计，面试官进一步探讨粒子滤波的适用性（计算量大，适合非线性非高斯场景）。多传感器同步：硬件触发（如PTP协议）降低时间偏差，软件插值法（线性/样条插值）补偿残差。伪代码需体现时间戳对齐与数据缓冲队列设计8。(3) 场景设计与系统思维停车场调度系统：地图建模：栅格化（障碍物标记）或图结构（节点为车位/路口）。动态障碍物处理：局部重规划（D* Lite）或实时避障（RRT*）。优化目标：面试官倾向于时间最短（用户体验）而非转向最少（硬件损耗）。二、面试官考察维度与策略技术深度：算法岗核心考察代码实现能力（如手撕NMS）与数学推导（如梯度消失解决方案）。项目经历需提炼技术链条（数据输入→处理逻辑→输出优化），并准备失败案例复盘。行业洞察：总监面高频问题：对比竞品技术（如特斯拉FSD的决策逻辑），需熟悉文远知行多传感器融合方案。压力测试：HR面常见陷阱问题（如“何时离职实习”），建议强调职业规划与公司契合度。三、备考策略与资源推荐算法强化：刷题：LeetCode动态规划TOP 100、几何题库（线段/矩形相交）。系统设计：智能指针、线程池等高频考点。行业知识储备：必读文远知行技术文章（官网及知乎专栏），重点学习BEV感知、时序融合等前沿方向。竞品分析：Waymo的仿真系统、Cruise的路径规划特点。项目包装技巧：使用STAR法则描述项目（情境→任务→行动→结果），突出量化指标（如算法精度提升20%）。四、内推与招聘动态当前机会：文远知行2025届春招及2026届实习开放中，算法岗（感知/规划/控制）需求量大。内推优势：通过内推码（DS17ugTB）可加速简历筛选，优先获得面试机会。内推链接如下：https://app.mokahr.com/m/campus_apply/jingchi/2137?recommendCode=DS17ugTB#/jobs投递建议：关注官网及招聘平台更新，匹配岗位JD调整简历关键词（如“多传感器融合”“点云分割”）。文远知行面试注重算法功底、工程落地能力与行业敏锐度。建议候选人结合自身项目，深度挖掘技术细节，同时加强对自动驾驶产业链（如芯片、传感器、法规）的宏观理解。笔者整理的真题与经验可私信获取，预祝各位斩获心仪Offer！

点赞评论收藏

分享

04-07 22:54

中山大学算法工程师

通过大厂辅导老师，我走了哪些捷径

通过大厂辅导老师，我走了哪些捷径想要进入互联网行业，从事高薪算法工作的朋友，如何走捷径，拿到算法 offer ？✴️自我介绍：我是转行进入算法行业，没有专业经历，但现已入职大厂，并且实现薪资大幅提升。✴️弯道超车:刚开始转行缺乏具体规划的时候，找了来自阿里，字节，腾讯等一线互联网大厂的在职算法工程师团队进行辅导，针对当前热门的算法就业方向，老师带着做大厂的算法项目，注重实践能力和面试能力的提升。✴️项目方向（热门方向）:1️⃣AIGC图像生成2️⃣多模态大模型3️⃣大语言模型4️⃣搜索，广告，推荐5️⃣自动驾驶我选择了1️⃣AIGC图像生成和2️⃣多模态大模型两个方向。✴️项目辅导流程：形式是1V1上课＋课后实践＋答疑。具体包括：理解项目流程，实践项目代码，学习方法原理，梳理面试问题，修改简历，提供虚拟面试等内容。✴️时间：老师会根据我的时间灵活安排课程，整个辅导我花了2个月左右，但后续也会因为各种琐事叨扰他们，他们是我在大厂的第一份人脉，哈哈🤗✴️成果：最终我的简历上增加了两个高质量的项目，相当于我的实习经历，并且有了这两个项目做基础，我的简历提升和面试过程就轻松了些，现在已经成功上岸！

点赞评论收藏

分享

09-04 16:21

门头沟学院算法工程师

自动驾驶算法校招

博主是去年校招进来的，我司福利待遇非常好，感兴趣的投递一下简历呀，岗位多多，base苏州，薪资和福利待遇都很顶级，投递简历使用内推码，NTAatYc，简历优先筛选，私聊可帮看进度，社招也可以用内推哦

点赞评论收藏

分享

05-21 20:12

中山大学算法工程师

面试题:为什么 GRPO 容易出现 reward 崩塌？

✴️算法面试中遇到一道实战场景题：在大模型训练中使用GRPO，训到一半 reward 就很容易突然掉下来的原因？GRPO 出现这个问题，需要详细了解强化学习（RL）的基本迭代架构，即 Actor-Critic 架构。知行互动（AC）架构为什么要有 Critic 呢？这就涉及强化学习的算法稳定性问题。与监督学习（SL）相比，RL 实际上是很难稳定的一类训练机制。💣大致的原因如下：RL 本身是处理动态系统的最优控制问题，而 SL 是处理一个静态优化问题。动，就比静更难处理。加上 RL 的数据非稳态，Env-agent 交互机制的数据采集量少，这使得梯度计算的方差更大，方差一大就容易偏离预期目标，算法就容易跑飞了。主流的强化学习算法是怎么解决这一问题的呢？加上 Critic，使用 State-value function 或者 Action-value function 稳定策略梯度的计算过程。更高级一些的算法是采用 Advantage Function，也就是加上了 Baseline，增加梯度计算的稳定性。这是 AC 算法总是优于 REINFORCE 算法的原因之一。✅然而 GRPO 并没有 Critic 部分，原因比较简单，因为 GRPO 是用于训练大模型（1000 亿级别的参数规模），若是使用“知行互动”架构的话，等于需要存储两个大模型。Critic Network和 Actor Network，对存储要求极高。怎么节约存储呢？把 Critic Network 去掉，替换为在线估计 Advantage function 的算法，采用了“时间（算力）”换“空间（存储）”的做法。这就是 GRPO 的设计思想。与之对比，OpenAI 提出的 PPO 算法（也是 GRPO 的基础算法），它的值函数通常是一个与策略模型大小相当的模型，这带来了显著的内存和计算负担。考虑到 OpenAI 并不缺算力资源，不缺存储资源，即使 PPO 算法设计的如此糟糕，照样用的风生水起。🤳回到最初的话题，从原理上看 GRPO 并非完美，与 PPO 相比实际上处于是半斤八两的水平，算法设计存在“稳定性”缺陷，但是为什么 DeepSeek 还能用的比较好呢？因为 DeepSeek 的数据足够多，多到可以“完美”地避开 GRPO 的稳定性缺陷。每次的 Policy Gradient 计算，只要 Batch 数据足够多，就能有效降低 Policy Gradient 的方差，就能获得比较稳定的迭代。当每次使用的数据批量比较小的时候，它的稳定性缺陷将是致命的。这类规模的策略训练，建议优先选择带有 Critic 的强化学习算法。🌟如果大家想了解高质量的项目辅导以及提升面试能力，欢迎后台咨询。

点赞评论收藏

分享

玩命加载中

创作者周榜

更多

热议话题

更多

牛客网
牛客网在线编程
牛客网题解
牛客企业服务