今天 03:15 门头沟学院算法工程师

关注

蚂蚁实习 AI agent算法二面 1h

攒人品中，祝大家都能拿到满意的Offer！
1.项目拷打
2. 实习拷打
3. 你们选用的训练方法是什么？训练数据具体是怎么构造的？
4. 这里的训练过程，我理解是前面有一段医学语料的预训练，然后再加一段对齐过程，是这样吗？
5. 关于 SFT 阶段，数据具体是怎么生成的？
6. SFT 之后，后面的 DPO 过程又是如何开展的？
7. DPO 需要 Chosen 和 Rejected 至少两组对比数据，这两组数据你们是怎么得到的？
8. 我们现在这边可能对于医疗业务关系比较远，问一下更加基础的知识。既然谈到 DPO，谈一下 DPO 以及后续其他偏好学习算法的区别，以及各自的优劣。
9. 那么 GRPO 算法呢？
10. DPO 算法有哪些缺点？
11. 谈谈强化学习中 On-policy 和 Off-policy 的区别，你是怎么理解的？
12. 看你不仅做训练，还负责基础设施 Infra 的搭建。训练基础设施也是归你亲自搭吗？
13. 当时是在哪个项目里面参与 Infra 工作的
14. 你刚才提到了 Megatron，你们试过 PyTorch 原生的 FSDP 吗？
15. 既然试过 FSDP，为什么最终还是选用了 Megatron？，你们当时的选型考量是什么？
16. 既然提到 FSDP 和 DeepSpeed ZeRO 的区别，FSDP 实现了 ZeRO 的哪几个阶段？ZeRO-1, 2 还是 3？
17. 探讨一个现实的业务问题：我们核心业务是对话类 Agent 产品。经典架构是前端设有一个意图识别与路由环节，将客户请求分发到不同的子 Agent，由于子 Agent 功能实现完全不同，不能混在一起，所以路由非常关键，一旦路由错误就无法满意回答。另外，作为全链路的必经点，路由必须足够快。我们考虑在最前端用一个相对较小（如 7B 或 13B）的模型，通过后训练使其掌握特定领域知识，实现低延迟的路由。如果让你做这个模型，你会怎么去做？

全部评论

推荐最新楼层

04-11 20:26

已编辑

广东工业大学 Java

现在还在死刷 LeetCode 的，是不是有点落后了？

说个可能会被喷的事。我朋友春招真的没怎么刷题。LeetCode 也就几十题，八股文也是零零散散地看。结果他拿了 offer。我刷了 300 多题。每天背操作系统、计算机网络、JVM、MySQL。说实话，我当时心态有点崩。后来才知道，他面试的时候一直在用一个软件，叫 nymard。他说了一句话让我印象很深：“现在面试拼的不是谁背得多，是谁临场组织得更快。”我突然意识到一件事——我们这些苦刷几百题的人，会不会只是效率太低？2026 年了。还在完全手工式准备面试，是不是就像别人开拖拉机，你还在手耕？我知道肯定有人会说这是作弊。但面试官看的是表达、思路、完整度。如果工具能放大你本来就会的东西，那到底算不算作弊？真心想听听大家的看法：努力本身还值钱吗？还是说工具时代已经变了？欢迎喷。

Morph_：广告太刻意了

点赞评论收藏

分享

昨天 01:25

Java

一定要干开发吗？

现在是凌晨一点二十一分，最近几天我内心无比的烦躁，总感觉找不到实习就完蛋了，突然就在此刻，我好像想通了，我不想去再为了工作而学习了，我想为了热爱而学习，我想做一个融入我自己思想的东西，……算了，早日找到实习吧。

程序员小白条：无论为了热爱还是其他，都得跟别人比较，竞争，AI 现在更是加快了节奏

点赞评论收藏

分享

04-10 21:29

北京信息科技大学 Java

点赞评论收藏

分享

04-09 19:35

门头沟学院 Java

字节面评脏了

暑期实习投了字节的ai agent某部门的岗，一面过了，二面被挂了；之后我在boss上投递均无响应，今天有一个hr告诉我最近面试不理想，这边岗位估计难了；意思是不是字节面评脏了，暑期实习彻底没机会了

挂玉牌的瘪佬星：一样，处女面给了字节，算法题没写出来，然后投日常都直接简历挂

字节求职进展汇总

点赞评论收藏

分享

04-10 17:55

重庆大学 Java

暑期意外的结束了

美团timeline一面 3.26二面 4.2oc 4.8offer 4.10其他：oppo 一面挂vivo 没动静携程 笔试挂哔哩哔哩 没动静感想感觉找实习运气也占不少的成分，本来0实习选手暑期只是准备随便投一下练一练，想着过会儿再找日常实习，没想到美团直接收留我了。感谢一面面试官，在我第一次面大厂的时候给了我自信

ZQFbest：感觉美团一堆KPI

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的求职进度条 #

985485次浏览 6544人参与

# 携程笔试 #

153602次浏览 890人参与

# 厦门银行科技岗值不值得投 #

18978次浏览 422人参与

# 米哈游工作体验 #

29925次浏览 145人参与

# 拼多多集团-PDD笔试 #

64496次浏览 486人参与

# 哪些公司一直卡在简历筛选 #

105847次浏览 361人参与

# 中国电信笔试 #

40788次浏览 399人参与

# 拿到offer之后，可以做些什么 #

104811次浏览 511人参与

# 入职第一天，你准备什么时候下班 #

118256次浏览 516人参与

# Agent面试会问什么？ #

38846次浏览 1424人参与

# 一人分享一个skill #

10024次浏览 243人参与

# 说说你知道的学历厂 #

401651次浏览 1433人参与

# 春招至今，你收到几个面试了？ #

101542次浏览 1261人参与

# 选实习，你更看重哪方面？ #

76816次浏览 505人参与

# 拼多多工作体验 #

55394次浏览 389人参与

# 记录实习开销 #

214542次浏览 1747人参与

# 你觉得专业和学校哪个对薪资影响最大 #

104550次浏览 620人参与

# 给工作过的公司写一条大众点评，你会怎么写？ #

12544次浏览 144人参与

# TCL求职进展汇总 #

152329次浏览 665人参与

# 通信/硬件的薪资开多少，才值得去？ #

76797次浏览 407人参与

# 面试体验最好和最差的公司 #

25633次浏览 171人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务