逐际动力 机器人强化学习实习 一面(挂)

面试时间:5月20日16:00(库名人520面试)
面试岗位:机器人强化学习(实习)
面试问题:

上来就问项目(本人项目是双足机器人RL+locomotion),问题包括,

1. 为什么要设计并行worker并行采样解构?
2. PPO的Loss由哪几项组成?(典中典)
3. 能不能用总的Loss去更新Policy和Value网络?(我是将Loss拆开来分别更新的)
4. 用了多少时间(多少步)来训练达到这个效果?

还问了两个Python的问题,函数前@啥意思(修饰器)

反问

面试体验:聊得挺顺畅的,问答比1:3左右,就是挂。事后总结感觉不缺人。

#面经##具身智能##机器人##强化学习##实习#
全部评论

相关推荐

不愿透露姓名的神秘牛友
06-18 20:40
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务