逐际动力 机器人强化学习实习 一面(挂)

面试时间:5月20日16:00(库名人520面试)
面试岗位:机器人强化学习(实习)
面试问题:

上来就问项目(本人项目是双足机器人RL+locomotion),问题包括,

1. 为什么要设计并行worker并行采样解构?
2. PPO的Loss由哪几项组成?(典中典)
3. 能不能用总的Loss去更新Policy和Value网络?(我是将Loss拆开来分别更新的)
4. 用了多少时间(多少步)来训练达到这个效果?

还问了两个Python的问题,函数前@啥意思(修饰器)

反问

面试体验:聊得挺顺畅的,问答比1:3左右,就是挂。事后总结感觉不缺人。

#面经##具身智能##机器人##强化学习##实习#
全部评论
佬想了解一下
点赞 回复 分享
发布于 2025-08-22 10:23 安徽

相关推荐

05-13 00:41
已编辑
北京邮电大学 Java
理性的杰克刷牛客:ai肯定要有的,最好学一下agent方向加一个智能客服什么的进去,并且多加点什么skill,mcp啥的,另外你现在的项目深度有些浅,这些功能都太简单了,而且也不是真正能扛高并发的实现,没有什么太大的亮点,可以去网上找点更有深度的项目。可以先投一些中小厂,有实习经历以后再去大厂,你现在这个大厂可能机会不大
点赞 评论 收藏
分享
wu970:标准北漂配置,怎么看着装修风格有点像自如的😭
点赞 评论 收藏
分享
评论
5
25
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务