滴滴内推,滴滴内推码,滴滴秋招内推

滴滴面经|一天三面,已发意向书,冲冲冲

面完都准备休息了发现十分钟后二面,看了眼邮件发现是连环面试,于是一口气面了三轮,一面二面都是五十分钟,各有一道简单的代码题,三面半小时左右

1️⃣ 一面50min,一道代码题1 聊项目20分钟2 传统的强化学习与LLM中的强化学习的对应关系3 介绍一下PPO,GRPO这几个算法的区别4 AI Coding用过那些 如果你来设计 要包含哪些模块5 代码题:动态规划6 反问

2️⃣ 二面50min,一道代码题1 聊项目20分钟2 Decoder-only的主要组成3 解释一下自注意力,交叉注意力4 常见位置编码了解哪些5 传统策略梯度的收敛性有理论上能收敛吗(能,但条件苛刻),LLM做强化学习训练时怎么能更容易收敛6 代码题:斐波那契数列变种 后续问了下理论解怎么求(特征方程)7 反问

3️⃣ 三面30min,无代码1 做项目的时候遇到最大困难了吗,怎么解决的2 项目的指标提升很大,具体怎么实现的3 强化学习在游戏场景下的主要应用与主要研究方向4 聊了一下Kimi K2的技术方案5 介绍了一下组里的方向6 反问 总体感觉在滴滴很舒服,工作强度不大,我所在的部门也没有太多dirty work ,mentor非常认真负责,不会push,还经常找我聊天和询问我有没有什么困难,同部门哥哥姐姐经常投喂我各种食物,真的很喜欢滴滴

内推链接:https://app.mokahr.com/m/campus_apply/didiglobal/96064?recommendCode=DSrx48tx&hash=%23%2Fjobs#/jobs

内推码:DSrx48tx

内推码:DSrx48tx

内推码:DSrx48tx

投递的同学评论区留言,如LXX+后端,方便后续跟进,随时查进度哇,欢迎一起交流,欢迎各位大佬加入桔厂!

全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务