2024-03-20 【清风ZZZ】打卡_牛客网

2024-03-20 21:55 门头沟学院 Java 发布于北京

关注

今天，读了IN-CONTEXT REINFORCEMENT LEARNING WITH ALGORITHM DISTILLATION。其将强化学习建模成了顺序预测问题，通过历史预测下一个动作，同时历史可以看成context。算法步骤就是通过source RL算法生成数据，然后在给定先前learning history作为context，通过自回归与预测action，来训练causal Trasnformer（这个过程就是文中说地算法蒸馏）。然后，又看了离线强化学习经典论文CQL。

在牛客打卡4天，今天也很努力鸭！

每日监督打卡

全部评论

推荐最新楼层

04-07 01:06

中山大学 Java

虾皮春招笔试

5单选+5单选+5多选前五道单选类似于思维题，不过做起来也没多大把握，感觉跟专业知识没多大关系后五道单选和多选对于我这种八股只学了JavaSE和Java并发的来说很难，完全看不懂，全都乱选唯一记得的一道是对32个对象进行快排用了32ms，问对1000个对象应该用多久编程题不难，都ac了第一道核心代码模式，合并两个有序数组，从最后一位开始比较合并就好了第二道核心代码模式，是岛屿题的变种，01二维数组迷宫，从（0，0）起点，1为不可达，问有多少个不可达区域用dfs解决第三道acm模式，输入[0,2,1,3]，0和1是情侣，2和3是情侣，要坐在一起求最小交换次数，看了一会，发现最小交换次数就是没坐在...

查看4道真题和解析

点赞评论收藏

分享

04-07 16:13

苏州百年职业学院 HRBP

别把AI当人看

今年秋招开始，感觉很多公司都上了AI面试，而且几乎都是第一关，就要面对AI 。虽然但是，面得多了就摸清套路了。AI面本质是个无情的特征提取器，问题就三大类：1.行为特征题：必考！“分享一次你带领团队完成目标的经历”。它不是在听故事，是在抓取“领导力”、“协作”、“结果导向”等关键词，并分析你的表达结构是否清晰。一定用STAR法则提前写好稿子，对着摄像头练到面无表情也能流畅说完。 2.情景压力题：“如果和同事发生严重分歧，怎么办？” 它评估你的应对模式和价值观。回答要体现“职业化”和“建设性”——先沟通，再对齐目标，最后找解决方案。切忌情绪化抱怨。 3.岗位匹配题：“你为什么适合这个岗位？” 它...

Agent面试会问什么？

点赞评论收藏

分享

03-24 14:04

门头沟学院 Web前端

不是我应聘个it技术支持岗位4-6k 还学历歧视上了😭

不知道怎么取名字_：看来现在卷的，这种单位都开始提高要求了

点赞评论收藏

分享

不愿透露姓名的神秘牛友

03-09 19:13

这种实习能去吗？    

求你们别卷了的大学生...：你不骂他，我就要骂你了

今天你投了哪些公司？

点赞评论收藏

分享

04-07 20:35

中国传媒大学数据分析师

Agent 面试会问什么？

一、基础概念类说说你对 Agent 的理解，和传统 LLM 有什么区别？常见的 Agent 架构有哪些？ReAct、Reflexion、Plan-and-Solve 你用过哪些？Tool Calling 原理是什么？怎么保证工具调用稳定？RAG 和 Agent 怎么结合？各自适用什么场景？二、技术实现类你做过的 Agent 项目流程是怎样的？从 0 到 1 怎么搭建？如何做 Prompt 工程优化 Agent 的思考与执行？多轮对话中怎么维护状态、记忆和上下文？遇到模型拒绝执行、幻觉、工具调用失败怎么解决？有没有做过多 Agent 协作？任务如何拆分、调度？向量数据库怎么选？chunk 大小、...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# Agent面试会问什么？ #

30689次浏览 1220人参与

# 通信/硬件的薪资开多少，才值得去？ #

76211次浏览 406人参与

# 厦门银行科技岗值不值得投 #

18563次浏览 420人参与

# 面试体验最好和最差的公司 #

22333次浏览 159人参与

# 美团笔试 #

889064次浏览 5592人参与

# 我的求职进度条 #

979124次浏览 6512人参与

# 哪些公司一直卡在简历筛选 #

103254次浏览 339人参与

# 拿到offer之后，可以做些什么 #

103257次浏览 505人参与

# 说说你知道的学历厂 #

399137次浏览 1420人参与

# 平台or薪资硬件uu更看重哪个 #

167043次浏览 624人参与

# bilibili求职进展汇总 #

190563次浏览 1091人参与

# 听劝，这个公司值得去吗 #

714705次浏览 2024人参与

# 一人分享一个skill #

8052次浏览 218人参与

# 春招至今，你收到几个面试了？ #

78896次浏览 1041人参与

# 给工作过的公司写一条大众点评，你会怎么写？ #

10762次浏览 131人参与

# 美团秋招笔试 #

207958次浏览 1166人参与

# 拼多多工作体验 #

55129次浏览 387人参与

# 一人说一个提前实习的好处 #

122942次浏览 715人参与

# 烂工作和没工作哪个更痛苦？ #

17870次浏览 271人参与

# 巨人网络求职进展汇总 #

193644次浏览 1232人参与

# AI替代不了什么？ #

12035次浏览 201人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务