算法打工人小旺

08-10 09:27 中山大学算法工程师发布于山东

关注

百度提前批一面：说下grpo训练loss怎么算

1.自我介绍1min
2.项目介绍，提到了grpo训练
3.说一下grpo的原理以及loss计算
（从策略梯度公式推导开始讲，以及grpo的组间reward怎么算的）
4.为什么需要加上kl约束
（防止更新不稳定，探索太远了）
5.grpo的kl是怎么计算的
（记得是k3-kl）
6.那如果你训练中大量出现全对全错的样本怎么办
（直接丢弃？）
7.如果全部丢弃，会带来什么问题？
（我说有论文表示丢弃没啥问题hhh）
8.面试官摇头，我说那要不再多rollout几个样本
9.怎么多rollout几个？你算一下如果是8张A100训练7B的模型，grpo可以rollout几个样本不炸显存？
10.coding torch写一下grpo的loss吧
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

今天 14:38

南开大学 Java

东子 26校招 后端 一面20多分钟结束，问了点java基础知识，问了点实习，剩下纯闲聊是不是被当kpi刷了

多多爱我我爱多多：别说了来我多多

大厂面试问八股多还是项目...

点赞评论收藏

分享

08-08 18:02

原力灵机（北京）机器人科技有限公司_强化学习算法工程师(准入职员工)

旷视科技内推

旷视——NLP面经8.31三面1h简历上东西讲了个遍；面试官对我的科研很感兴趣，面完加了我vx8.28二面 1h1.  常规实习项目介绍2. 给一个点的坐标，和一个长方体的中心点，长宽高，和对应的三个角度，如何判断这个点在不在长方体内。3. 给一个点的坐标，和一个多边形的各个顶点坐标，如何判断在不在多边形内部（二维4. 给一个点的坐标，和一个凸多面体的各个顶点坐标，如何判断在不在多面体内部（三维5. 如何判断凸多面体的几个点在不在一个平面被面试官疯狂拷打8.22一面 1h1. 介绍lora，p-turing，各自优缺点2. 如何解决content length长度问题3. 如何解决大模型遗忘问...

点赞评论收藏

分享

08-09 00:40

上海第二工业大学汽车设计

#秋招笔试记录#

秋招笔试记录

点赞评论收藏

分享

08-05 20:32

苏州大学集成电路IC设计

上班见识了形形色色的人吧

之前在抖音看到某个博主日常上班vlog，总是积极向上，充满激励。我其实比较羡慕这种镜头下的状态，也常告诉自己少年心气是不可滋生的朝气。可能我上面还有带队的，所以有时候其实压力不是很大，就是汇报或者培训的时候可能累点，有时候有问题去解决，觉得大家一起费心思的时候，并不觉得特别痛苦。上班也见识了各种各样性格的朋友，有的沉默寡言但却很可靠，有的外表大大咧咧但细节拉满，有的总是喊苦却比谁都卷。认识到这样的一批人，本身就是成长吧。唯一难受的就是，班上久了，有时候会有点恍惚，莫名的会觉得累，周末躺着的时候，总是会发呆，一下子觉得乏味，分不清到底是看到了未来，还是看不到未来。

投递字节跳动等公司10个岗位

点赞评论收藏

分享

08-18 16:42

门头沟学院内外饰设计工程师

熟练背诵问题的答案

克服面试紧张的方法多种多样，我分享一个最有用的，那就是把很多常用的面试问题都写好，背熟。有的人会写在纸上，或者放在note里，但是这样很容易被发现。最好的就是放在脑子里，背诵，狠狠地背诵。自我介绍，一分钟三分钟，两个版本。缺点，准备两个，案例背熟。就写在纸上好好背就好了，大道至简。

面试太紧张了怎么办？

点赞评论收藏

分享

评论

1

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试太紧张了怎么办？ #

15763次浏览 292人参与

# 中兴工作体验 #

21195次浏览 265人参与

# 你怎么看待AI面试 #

11384次浏览 151人参与

# 机械求职避坑tips #

56128次浏览 389人参与

# 实习需要主动找活干吗？ #

12237次浏览 131人参与

# 业务面应该做哪些准备 #

5417次浏览 131人参与

# 大厂面试问八股多还是项目多？ #

8375次浏览 144人参与

# 国企vs私企，你更想去？ #

252692次浏览 2237人参与

# 转正答辩报告怎么写 #

5538次浏览 69人参与

# 你是如何祛除班味的 #

4176次浏览 80人参与

# 摸鱼被leader发现了怎么办 #

62615次浏览 374人参与

# 你有没有为省钱「拼过命」 #

4815次浏览 94人参与

# 我的职场心眼子段位 #

41827次浏览 698人参与

# 你被mentor骂过吗？ #

20029次浏览 122人参与

# 移动求职进展汇总 #

6245次浏览 61人参与

# 实习中的菜狗时刻 #

423766次浏览 3473人参与

# 双非能在秋招上岸吗？ #

238154次浏览 1268人参与

# 你们的毕业论文什么进度了 #

1119759次浏览 9764人参与

# 秋招投递记录 #

41781次浏览 451人参与

# 我想去国央企的原因 #

63300次浏览 401人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务