算法打工人阿旺

2025-11-05 23:13 中山大学算法工程师发布于山东

关注

蚂蚁金服一二面面经

1️⃣一面
1、介绍自己的中厂实习，从业务背景，困难，解决方法，自己的产出四个维度阐述。
2、 ppo 和 dpo 区别和原理（因为实习做的就是 rl 相关）
3、是不是用的 Verl 框架做的 rl ？详细讲一下 verl 框架的训练流程。并讲一下配置文件中 rollout _ batchsize , global _ batch _ size , micro _ batch _ size _ per _ device _ for _ update , rollout . n 等等参数的关系，以及他们如何影响最终更新时每张显卡上的样本数。
4、reward function 如何设计的为什么这么设计？
5、critic model 作用是什么？为什么有了 reward model 还需要 critic model ?
6、有没有了解最近的 rl 方法？过了一遍 grpo , dapo , gspo 过了的主要改进点
7、计算机基础八股： B 树和 B 一树的区别。如果 CPU 突然被打满了，如何排查？什么情况下会出现锁，如何解决。
8、核心代码模式，写一下大模型预测
token 时， beam 树如何构建，如何得到最终的结果（ pytorch 简单实现了一下，主要是还是讲明白）
9、手撕hot100，中等题，最小生成树。
2️⃣二面
1、简单介绍中厂实习经历。
2、模型蒸馏的数据如何做的？如何清洗蒸馏得到的数据？
3、有没有使用强化学习做过数据仿真。这个之前看过一篇论文，刚好讲了一下。
4、有没有了解过训练推理一致性这个领域？我讲了一下强化学习领域的推训一致性，固定 flash attention 分块策略， vllm 推理框架固定 page attention 分块策略。
5、模型量化如何做的。 gptq , qat 等等，并说明为什么选择了w8a16的量化？
6、写一下 ppo 算法的损失函数和 GAE 优势函数。主要还是讲明白
7、 grpo 算法中 kl 散度和之前的方法有什么区别？在 dapo 中为何舍弃了 kl 散度？
8、模型蒸馏主要的两种方式。硬标签和软标签。
9、介绍一下 kmeans 算法，如何设置合适的 k 值。如果在一个非常大的数据量中，如何实时增量更新，并动态管理 k 值。
10、一个场景题
11、手撕题hot100，中等题，合并 k 个升序链表。
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

05-21 09:23

北京邮电大学嵌入式工程师

硬件真能躲避35中年危机吗？

看到一个来自35岁80后硬件老玩家的回复。经常会在往上看到有人探讨，嵌入式有35岁危机吗？我今年正好35，曾经在一线干了单片机开发10年。前几年出来单干了，不过现在让我出去找工作，一点压力也没有。我身边有一些96后，00后的小年轻，他们普遍的想法都是：1.想加班？不可能！2.只能单休? 那我还是不干了！3.工资低？凭什么给你卖命！通过无际单片机的项目找到工作的那些小年轻，很多都是这想法。我觉得他们不是去工作，而是去整顿职场。对比我们那个年纪，伤害性不大，污辱性极强，我们这代80后挣的全TM是窝囊费。我考你一个问题：一个企业主，喜欢招一个随时可能“仗剑走天涯”的浪子，还是一个听话的小奶狗？正常的...

点赞评论收藏

分享

05-25 14:28

西京学院 Java

我做了一个面试复盘工具

每次面完试人都麻了，精力耗尽还要强撑着复盘，不复盘吧感觉白面了；复盘吧真的提不起劲。 后来想能不能有个工具帮我自动干这事？于是做了一个 AI 面试复盘助手，现在已经上线可用了。 上传面试录音（MP3/WAV/M4A/FLAC/OGG ），系统自动做语音转文字 + 说话人分离，然后一键输出： ● 训练状态评估：判断你处于哪个阶段——初始训练期、基础稳定期、压力适应期还是面试成熟期 ● 语音指标分析：语速 WPM 折线图、填充词密度（按分钟分布）、长停顿检测（>5s）、沉默比 ● 完整诊断报告：Markdown 格式，可直接下载 不想上传也有示例数据。 ● Top 3 Signals：找出最...

我的求职进度条

点赞评论收藏

分享

03-30 17:14

浙江大学 .NET

去大厂，得到的总比你想象的多

说个可能不太"ZZ正确"的大实话：大厂实习经历在找工作中的加成，比你想象的大太多了。我去年暑期在某大厂做推荐系统实习，说实话活不算特别有深度，主要是做特征工程和一些AB实验。但秋招的时候，简历上这一行带来的好处是全方位的。首先是过筛。投了20家，70%的简历通过率。我室友背景跟我差不多，但实习是一家没听过名字的小公司，15家过了3家。你说是能力差距吗？不是，纯粹HR看到大厂名字就默认你至少不差。其次是面试氛围。面试官看到你在xx厂实习过，态度明显不一样，会默认你的基础能力没问题，更多地聊项目思路和方向判断，而不是从头盘问你基础知识。我室友面试经常被追问八股文，我反而很少被问到。

愿offer多多的长...：道理我都懂，怎么进大厂

大厂实习和小厂实习最大的...

点赞评论收藏

分享

不愿透露姓名的神秘牛友

05-13 16:09

离大谱！入职第二周mentor跳槽了😭

我入职那天分到的mentor是个工作三年的哥们儿，外号杰哥，浙大本硕，技术贼好，人也特别耐心。第一周他手把手带我熟悉项目，下班还带我去公司食堂吃晚饭，跟我讲组里的人际关系、哪个产品好沟通、哪个测试爱挑刺。我当时心里那个踏实啊，心想这mentor是真带我，运气真好。我甚至已经开始幻想转正后跟着他干。周一下午四点多，我正在改一个特别恶心的bug，他飞书突然发我："小x，跟你说个事儿，我下周一是最后一天，我跳槽了，你之后跟着王哥学。"我当时直接回复了“？？？？”真的以为他在开玩笑。他发了一个尴尬笑的表情，"真的，offer上个月就拿了，一直没说"。我那一瞬间真的不知道说啥。下班的时候我特意去他工位转了一圈，他已经在收拾东西来，看见我笑了一下，说"我请你吃个饭吧"。我们去了公司楼下的麻辣烫。吃饭的时候他跟我说了很多，说大厂这边晋升路径太卷，说他家在外地啊老婆怀孕了啊想离家近点什么的，说新公司虽然小但是给的钱多。我一边吃一边点头，看到一个快到中年研发人的无奈，感觉也看到了未来的我，心里挺不是滋味的。今早上午他飞书里发我一个文档链接，是他这两年攒的项目笔记，模块分工、踩过的坑、谁负责啥都有。他说"这个你留着，遇到问题先看这个再找王哥吧"。说实话，我当时贼感动，工作的这两周，他可能是我在公司里唯一真正把我当回事儿的人了。最后，我想说兄弟们，找实习真的别只看大厂光环，mentor稳定性也是玄学之一。我现在心里有点空，感觉靠山没了

鹿LF：你mt不是才工作三年吗，怎么就中年研发人了

点赞评论收藏

分享

昨天 10:10

已编辑

北京邮电大学 Java

10年代码经验，分享我常用的AI工具

最近经常有人问我平时用什么AI工具写代码，索性整理一篇，把我日常开发中高频使用的工具和资源都列出来，供大家参考。一、编程开发核心三件套1、Claude Code这个不用多说，绝对的真神。我日常开发90%以上的场景都依赖它。无论是写业务逻辑、调试问题还是重构代码，它的理解能力和代码质量都让我非常满意，基本上已经成了我的第一生产力工具。2、Codex同样是真神级别的存在。但是和Claude Code还是有一定差距，偶尔会用。3、CC Switch可以让你在Claude Code、Codex等应用中灵活切换不同的模型，比如Qwen、DeepSeek以及GLM等。二、桌面AI客户端：Cherry St...

创作小队长：

太实用了，感谢马丁老师分享压箱底的私藏哈哈哈

聊聊我眼中的AI

点赞评论收藏

分享

评论

点赞

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

995045次浏览 5034人参与

# 国企是春招机械人最好的去处吗 #

153577次浏览 580人参与

# 发面经攒人品 #

8855810次浏览 98259人参与

# AI了，我在打一种很新的工 #

206472次浏览 2126人参与

# 27届实习投递记录 #

161905次浏览 1651人参与

# 万物皆可发面经 #

3799次浏览 54人参与

# 运营人求职交流聚集地 #

259907次浏览 1135人参与

# 实习，不懂就问 #

228245次浏览 1756人参与

# 秋招投递攻略 #

295671次浏览 2640人参与

# 实习生至暗时刻 #

93447次浏览 942人参与

# 从mentor身上学到了__ #

67574次浏览 942人参与

# 你的mentor是什么样的人？ #

66939次浏览 845人参与

# 父母对你找工作是助力还是阻力？ #

52193次浏览 463人参与

# 你觉得mentor喜欢什么样的实习生 #

63975次浏览 1083人参与

# 26届校招投递进展 #

682643次浏览 3968人参与

# 我和mentor的爱恨情仇 #

121409次浏览 1040人参与

# 找实习记录 #

282140次浏览 1663人参与

# 实习如何「偷」产出？ #

769435次浏览 8490人参与

# 牛友的志愿填报指南 #

73273次浏览 506人参与

# 第一次找实习，我建议__ #

89845次浏览 916人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务