荣耀算法实习 技术面经

感觉自己好菜、面试很难,还是要多多练习
1.项目介绍
2.手机助手项目背景,奖励是怎么分配到每一步的?数据量大小?长短链路比例?正负样本数据量?
3.R1复现数据分布?你怎么确定你的方案是有效的?采用的什么框架?GRPO相对于PPO有什么缺点?PPO到GRPO的思路?
4.为什么现在在实习还会投实习?
5.看过R1的文章是吧,讲一下他们是做了多少论训练。
全部评论

相关推荐

昨天 09:57
软件测试
程序员小白条:1)确定测试,测开的方向,技术栈不能写这么少 2)课程凑数的,不是99,100分没必要写 3)实习经历这块要有突出的不是劳动性质的亮点,自己设计的什么方案,什么自动化?什么提效工具?不是一些边角料,人云亦云的东西,没吸引力 4) 校园经历纯没用 5)尽量少写减分项
听劝,我这个简历该怎么改...
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务