阿里国际大模型算法一面分享 1h

压力拉满，考得比较深
1- 问项目
2- 为什么选择grpo不用sft，技术选型，什么时候用sft，什么时候用蒸馏，什么时候用grpo
3- grpo训练中观察什么指标
4- 八股：
5- grpo 的 loss 讲讲
6- Advangates 怎么算的，在整个训练中起什么作用，为什么需要Advatanges，直接用奖励去算不行吗？
7- 重要性采样，为什么需要。如果一次新策略和旧策略差别很大，那重要性采样还有用吗
8- grpo的kl散度和ppo的kl散度是一模一样的吗
9- ppo grpo 是on-policy还是off-policy
10- ppo中advantages是怎么得到的？
11- 信用分配，grpo中，比如一个采样结果，是序列级别的，如果这个序列的最终奖励高，那么是如何分配到每个token的
12- Agent 做多轮工具调用和单轮，可能有什么挑战？
13- code：x 的平方根（只保留整数部分）

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

可以的，写的很好呢

点赞回复分享

发布于 04-22 23:36 北京

05-07 19:09

三江学院 C++

AI Agent面经 5（持续更新）

Q1：规划和执⾏要不要拆开两个模型？答案：视任务⽽定。Planner-Executor 拆分可提升可控性（强模型规划、快模型执⾏）；单模型端到端更简单但易在⻓链路漂移。可混合：规划⽤强模型，执⾏层做确定性校验。Q2：如何避免 Agent 在⼯具调⽤间「迷失」？答案：明确 停⽌条件 与 最⼤步数维护 任务清单（todo） 与 当前⼦⽬标对每步输出要求 结构化（JSON）关键步骤 强制验证（单元测试式检查、⼆次 LLM 审核）Q3：结果冲突怎么整合？答案：优先级规则（权威源 > 时间新 > 多源⼀致）、让模型显式输出「冲突说明」、必要时触发⼈⼯。Q4：基于效⽤的 Agent 和基于⽬标...

大模型、Agent面试八...

点赞评论收藏

05-02 17:20

门头沟学院算法工程师

27实习阿里国际算法二面分享

发点面经攒攒人品～1.实习拷打2.有没有考虑用向量图检索，这样不用每次都跑大模型？3.正样本多还是负样本多？效果可以吗？4.Prompt是怎么做的？5.Transformer的归一化是怎么做的6.有哪些位置编码7.手撕：快速排序

查看6道真题和解析

点赞评论收藏

05-05 16:10

华为_系统工程师

【面试真题】美团Agent 方向面经整理（思路引导 + 推荐回答）

Agent / LLM 方向面经整理（思路引导 + 推荐回答）  每章开头有一小段本章思路引导（这类题整体上在考什么、怎么组织话）。每道题下先有一行思路（答题时先想什么），再是推荐回答（可参考的表述骨架）。请把里面的名词、数字换成你项目里的真实情况，别整段背。  一、写在前面 如果投的岗位对后端技术栈有一两条要求，你没有相关经历但业务还是放了简历进来，最好针对 JD 里那两条单独准备一下。其实就算 JD 没写死，HTTP、流式、异步这类也算互联网底座，有时间还是摸一遍皮毛，面试里至少能接住话头、显得你是主动补过的人。 没正经后端经历的（比如我），体感是面试官一般不会往死里抠实现细节，更在意知识...

点赞评论收藏

05-06 21:30

中国矿业大学（北京） Java

AI应用开发实习一面分享Momenta

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.离线数据处理咋做的？训练数据接入规范？2.阶段模型效果验证咋做？3.失败样本回流有做吗？4.断点重训咋做？5.交叉熵和KL散度区别？6.LangGraph/LangChain区别？状态快照机制了解吗？7.RAG八股略8.手撕二叉树中序

查看8道真题和解析

点赞评论收藏

05-12 10:10

已编辑

门头沟学院人工智能

非科班+本科目前正在做AI工程师，说说我这3年。。。

写这篇之前我犹豫了挺久。一方面是怕被人骂，"又一个收割焦虑的转行帖"；另一方面是看了太多用 GPT 套娃出来的「学习路线」文章，AI 味重得让人没法读完。所以这篇全是亲身踩过的坑，时间线、用过的项目、当时的心路全都尽量原样写出来。如果你是大学生在迷茫要不要转 AI，或者已经在转的路上，希望能给点参考。 一个反共识的开场：你以为进 OpenAI 的人都是博士？ 先讲个故事，跟我没关系，但跟所有想转 AI 的人都有关系。 OpenAI 的 Sora 团队（就是搞文生视频那个）一共 13 个人。这里面有两个人特别有意思： Will DePue，密歇根大学计算机系，直接辍学了。17...

_hengheng：我也本，也算是做ai相关，我最开始感觉做ai工程师有多么多么困难，后来发现懂了原理后整体训练完全可以看成一个流程化的内容，开源方案太多了，大多基本都是按着模子在自家业务上做各种操作，就算是大厂的小部门也没那么多资源去训基模，反而更多的是像怎么把技术往业务方向靠近了，不过当前时代如果本科学历没那么好加上自己执行力不是特别强还真不建议走ai工程师这条路，可以试试其他ai的偏业务方向，不然校招不太好杀出来

如何成为1个AI工程师？

点赞评论收藏