09-26 16:20 门头沟学院研发工程师

关注

美团研发二面

1. GRPO 算是 on-policy 还是 off-policy？为啥？

2. GRPO 用的数据不是最新的，为什么还算 on-policy？它的 buffer 是怎么回事？

3. 重要性采样是干嘛的？公式长啥样？能解释一下吗？

4. GSPO 和 DAPO 各自解决了什么问题？用了什么方法？

5. 强化学习里的熵崩溃是啥意思？怎么解决？有必要解决吗？

6. 熵崩溃是咋引起的？

7. 熵崩溃和 reward hacking 有关系吗？

8. 看过 DeepSeek 的技术报告吗？它在推理速度上做了哪些优化？或者说，模型层面有哪些加速推理的技巧？

9. MLA 是怎么回事？能加速推理吗？

10. Qwen3 和 DeepSeek-R1 有啥区别？

11. 怎么判断项目现在的评估指标是不是合适的？

全部评论

推荐最新楼层

昨天 20:17

门头沟学院 Java

字节开发二面凉经

1.大key问题和数据倾斜问题，怎么回事2.你觉得 Redis 的这个大 key 问题，它是怎么形成的？然后对 Redis 的影响是什么？3.从 redis 的一个实现角度来分析一下为什么会存在大 key 这样的问题？4.有 6 个集群是吧？每个集群是一个分片吗？5.比如像你接触过 Mongo 吗？或者 MySQL 接触过吗？他们为什么没有听说过有大 key 的问题呢？6. MySQL 它的数据存储结构和 Redis 数据存储结构有什么区别啊？7.他们在实现存储的数据结构上面，他们是分别选用什么？就比如说 MySQL 它落盘用了什么东西？然后 Redis 它用的是什么？8.上一个回答用哪一些数...

查看13道真题和解析

点赞评论收藏

09-25 23:07

已编辑

江西财经大学 Java

泰豪软件一面(30min)（已OC 拒二面）

1.stringbuilder和stringbuffer的区别2.==和equals3.JAVA中的异常捕获4.JAVA中的集合有哪些5.Hashmap为什么线程不安全？6.concurrentHashmap为什么线程安全？7.MySQL中聚合函数之后可以使用子查询嘛？8.mysql中的主流的日期函数？9.MySQL中查询前两天的数据该使用什么时间函数？10mysql中.delete和drop的区别？11.mysql中truncate和delete的区别？12.MySQL中行转列，列转行如何操作？13.有没有使用过游标？讲讲游标14.有两个数据库，一个查询数据库，一个写入数据库，如何使用mybatis随意切换这两个数据库？15.mabatis中如何进行批量插入16.jdbc的代码17.redis中常使用的数据结构有哪些？18.缓存击穿以及解决办法19.了解过redis中的spark嘛？20.Linux中如何建立防火墙策略？21.jvm中垃圾的回收机制？22.项目23.反问MySQL问的贼细，整个人都懵了，那些函数都是用到了就去找的记不住呀😭😭😭

查看22道真题和解析

点赞评论收藏

不愿透露姓名的神秘牛友

09-27 08:59

美团 agent算法面经

两三句介绍下agent以及当前的挑战transformer架构 有哪些机制解释下交叉注意力机制介绍下ppo dpo grpo算法grpo的loss怎么计算的 数据用的什么deepresearch和强化学习怎么结合应用解释下topk topp的实现原理手撕：非hot100投递的时候一定要看岗位偏应用落地还是偏算法。楼主算法功底比较薄弱，没有真实业务场景下的模型训练微调经验，在面试偏算法岗的时候，算法原理和训练过程被追着问

点赞评论收藏

昨天 21:57

河北工业大学 Java

有贝壳的Java岗收到oc了嘛

还没收到，是不是凉了😷

点赞评论收藏

09-26 10:48

虾皮信息_客户端开发工程师(准入职员工)

虾皮内推-虾皮内推码

虾皮前端面经，摘自优秀牛友拷打项目穿插八股父子之间传信(喝咖啡喝多了 脑子一片空白)所有不同hook的用法 Fiber (背的很熟)减少Dom的渲染方法 (背了一堆, 只记得useMemo, 真该死啊)手写,最长有效括号模拟url的并发请求, (在面试官的提醒下, 写完了)反问: 校招对应届生的要求面试官: 很好, 虽然一直卡壳, 但是一直在提醒我, 从薪资待遇上来说，Shopee在国内应该算得上Top级别，比肩BAT，技术算法应届生一般base在20-35k之间，可能会有部分的股票，总包大致在30-50w之间。对于产品/数据分析来说，base一般在18-27k之间。配上15天的年假，和五险一...

点赞评论收藏

全站热榜

创作者周榜

正在热议