基于人类反馈的强化学习（RLHF）是一种机器学习（ML）技术，它利用人类反馈来优_牛客网

牛客网ID612527157

2025-04-11 15:40 门头沟学院 Python 发布于广东

关注

基于人类反馈的强化学习（RLHF）是一种机器学习（ML）技术，它利用人类反馈来优化 ML 模型，从而更有效地进行自我学习。强化学习技术可训练软件做出可最大限度地提高回报的决策，使其结果更加准确。RLHF 将人类反馈纳入奖励功能，因此 ML 模型可以执行更符合人类目标、愿望和需求的任务。RLHF 广泛应用于生成式人工智能（生成式 AI）应用程序，包括大型语言模型（LLM）。

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

04-30 16:00

某小说公司面试感受

既然已经出结果了，也锐评一下这家公司的面试流程（nbcs）。个位数的岗位，简历也不知道是不是真的认真筛过，貌似不相关经历的也邀请来面试，候选人池子之深可想而知。于是乎面试一个岗位分了上午，中午，下午各个场次，还不止一天，给主包安排在早上8点多，前滩这个地方附近也没有实惠的酒店，于是得从酒店很早起床来参加线下面试。到了地方还得先听一边HR介绍公司，介绍完又领到一个地方等。面试遇到三个面试官+HR，一个面试官全程不说话，从不正眼看人，甚至一脸戏谑，不知道在打量什么；一个全程戴口罩，是感冒了还是咋的了也不知道。提的问题和简历的经历项目毫无关联，面试者回答完没有任何反应，毫无交流，反而像走流程一样，奇...

点赞评论收藏

分享

04-30 08:48

门头沟学院 Java

有时，线下小众渠道更有效

最开始跟大家一样，把牛客、BOSS直聘、智联招聘刷烂了，前前后后海投了200多份简历，结果90%已读不回，剩下10%连笔试机会都没给，整个人陷入了深深的自我怀疑，觉得自己毕业即失业。那时候我天天在出租屋里刷新招聘软件，刷到眼睛都花了，还是一点回音都没有。跟已经工作的学长吐槽，他一句话点醒了我：“线上海投本来就是大海捞针，HR一天收上千份简历，根本看不到你的。想拿面试，就得走别人不走的渠道，让你的简历被HR真真切切看到。”也是从那时候起，我放弃了纯线上海投，开始找各种线下和小众的投递渠道，前后折腾了一个月，终于拿到了3个杭州互联网公司的后端开发offer，其中还有一家是我之前海投根本过不了简历关...

除了线上，还能去哪些地方...

点赞评论收藏

分享

04-20 22:20

东莞理工学院 Java

目前简历是这样的，求问大佬有什么建议

点赞评论收藏

分享

04-28 15:42

郑州大学 C++

午休完裸面，网易某部门。 困死我了😵

找工作勤劳小蜜蜂：网易这几个月在大面积裁员，外包岗全退，今年网易收缩严重，建议慎重考虑网易

点赞评论收藏

分享

05-02 22:17

北京理工大学 Java

美团暑期一面+京东暑期一面

都是前段时间面的，之前在忙实验室的项目没时间整理，现在简单整理下。美团和京东都是挂了之后的第二次一面，京东目前没出结果，美团一面过了约我五一后二面，但是滴滴已经给offer，大概率不去面了。美团一面你这个方向是网络安全，但你投的是后端开发，是什么原因？后端开发跟 Agent 开发，你更倾向于哪个？讲一下你第一个项目整个编排平台的执行过程。节点执行过程是不是分多个状态？还有其他状态吗？比如用户取消？用户取消的话，正在执行的节点会流转到什么状态？你们有没有用到状态机去做状态流转？还是纯靠业务判断？怎么保证状态流转的线程安全？如果有两个线程同时将节点从 running 改到成功，你怎么处理？数据库层...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

23530次浏览 187人参与

# 上班苦还是上学苦呢？ #

345835次浏览 2075人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

48244次浏览 521人参与

# 如果春招能重来，我会___ #

23905次浏览 250人参与

# 实习怎么做才有更好的产出 #

50277次浏览 458人参与

# 你会因为行情，降低找工作标准吗？ #

36729次浏览 298人参与

# 在爱玛，骑向未来 #

15093次浏览 335人参与

# 字节开奖 #

153506次浏览 712人参与

# 我的秋招“寄”录 #

476730次浏览 3064人参与

# 面试线索爆料 #

131181次浏览 706人参与

# 提名点击就挂的公司 #

144422次浏览 492人参与

# 刚入职就____，这样正常吗？ #

144152次浏览 693人参与

# AI coding的好用工具分享 #

88724次浏览 567人参与

# 字节求职进展汇总 #

1851682次浏览 15436人参与

# 找工作以来，你最看不惯__ #

79619次浏览 594人参与

# 大学四年该怎么过，才不算浪费时间？ #

24021次浏览 107人参与

# 硬件人秋招的第一个offer #

129191次浏览 1473人参与

# AI“智障”时刻 #

40551次浏览 195人参与

# 业务面应该做哪些准备 #

128283次浏览 1345人参与

# 双非本科求职如何逆袭 #

1652018次浏览 13099人参与

# 双非应该如何逆袭？ #

589206次浏览 6410人参与

# 制造业的秋招小结 #

157515次浏览 2136人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务