1. 学习了C++中的字符串、string类:初始化,赋值,拼接,附加,输入。
2. 学习了C++的结构(体):结构体类型的定义,初始化
3. 读了Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced Datasets:本文首先发现:当数据集中存在大量非最优轨迹时,SOTA offlineRL算法难以显著的超过数据集中的平均return。本文认为这可能是因为当前的SOTA offlineRL算法总是贴近于数据集,而过度的贴近将导致策略模仿次优动作。本文的解决方式是提出一种采样方式使得策略仅被限制在好的数据中而不是数据集中的所有动作(均匀采样)。
2024-04-25
在牛客打卡10天,今天也很努力鸭!
全部评论
大佬是研究生吗?研究方向是离线强化学习?
点赞 回复 分享
发布于 2024-05-07 22:38 江苏

相关推荐

运营你豪哥:简历改改吧-非本、求职意向技术岗、无实习经历、内容空洞 如果简历不爆改的话,应该是会持续崩溃了 1.把你教育经历放最下面去 2.蓝底照片很奇怪哈,感觉还在高中时代,建议白底重新拍一下 3.校园经历没啥必要,收集和反馈同学们对产品的意见,解决学生和老师之间的沟通,企业招聘不看这些哈 好好思考一下简历的设计和你要表达的重点,再去投简历
点赞 评论 收藏
分享
06-11 13:34
门头沟学院 C++
offe从四面八方来:我真的没时间陪你闹了
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务