27字节agent开发实习一面

发点面经攒攒人品
1.项目拷打
2.PPT解析优化还有什么优化
3.agent调用工具不正确怎么办
4.采用 sft或者强化学习怎么来解决
5.ppo算法为什么有reward model 又有critic model
6.function cal能力提升采用grpo的话奖励函数怎么设计?除了结果奖励和可以怎么设计过程奖励
7.agent的记忆力机制,记忆力该怎么设计
全部评论
忍耐王
点赞 回复 分享
发布于 昨天 22:36 河南
借楼,谢谢!!希望对大家有帮助。 帮转-小红书视频剪辑Agent开源项目 帮转-求star FireRed-OpenStoryline 基于本地部署项目,使用起来更丝滑哦 github开源链接: https://github.com/FireRedTeam/FireRed-OpenStoryline/tree/main hugging face网页版体验链接: https://fireredteam-firered-openstoryline.hf.space/ RedTech公众号宣传推文: https://mp.weixin.qq.com/s/tr-SEjZp6fNVS6IrjIbCRg
点赞 回复 分享
发布于 昨天 22:31 江西
太强了佬
点赞 回复 分享
发布于 昨天 21:01 山东

相关推荐

士心凡_:进去后,问问题前先多用学城搜搜有没有解决文档,给mentor留个好印象。等你觉得他不在把你当实习生,而是当成同事的时候,和mt deeptalk一下,问一问有没有hc,没有的话再去冲一冲暑期
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务