逐际动力 机器人强化学习实习 一面(挂)

面试时间:5月20日16:00(库名人520面试)
面试岗位:机器人强化学习(实习)
面试问题:

上来就问项目(本人项目是双足机器人RL+locomotion),问题包括,

1. 为什么要设计并行worker并行采样解构?
2. PPO的Loss由哪几项组成?(典中典)
3. 能不能用总的Loss去更新Policy和Value网络?(我是将Loss拆开来分别更新的)
4. 用了多少时间(多少步)来训练达到这个效果?

还问了两个Python的问题,函数前@啥意思(修饰器)

反问

面试体验:聊得挺顺畅的,问答比1:3左右,就是挂。事后总结感觉不缺人。

#面经##具身智能##机器人##强化学习##实习#
全部评论
佬想了解一下
点赞 回复 分享
发布于 2025-08-22 10:23 安徽

相关推荐

不愿透露姓名的神秘牛友
05-13 14:16
战争学院:你妈妈第一反应是骗子,我妈妈第一反应是培训贷,全国家长系统是统一的吗哈哈哈
点赞 评论 收藏
分享
评论
5
25
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务