27字节agent开发实习一面
发点面经攒攒人品
1.项目拷打
2.PPT解析优化还有什么优化
3.agent调用工具不正确怎么办
4.采用 sft或者强化学习怎么来解决
5.ppo算法为什么有reward model 又有critic model
6.function cal能力提升采用grpo的话奖励函数怎么设计?除了结果奖励和可以怎么设计过程奖励
7.agent的记忆力机制,记忆力该怎么设计
1.项目拷打
2.PPT解析优化还有什么优化
3.agent调用工具不正确怎么办
4.采用 sft或者强化学习怎么来解决
5.ppo算法为什么有reward model 又有critic model
6.function cal能力提升采用grpo的话奖励函数怎么设计?除了结果奖励和可以怎么设计过程奖励
7.agent的记忆力机制,记忆力该怎么设计
全部评论
忍耐王
借楼,谢谢!!希望对大家有帮助。
帮转-小红书视频剪辑Agent开源项目
帮转-求star
FireRed-OpenStoryline
基于本地部署项目,使用起来更丝滑哦
github开源链接:
https://github.com/FireRedTeam/FireRed-OpenStoryline/tree/main
hugging face网页版体验链接:
https://fireredteam-firered-openstoryline.hf.space/
RedTech公众号宣传推文:
https://mp.weixin.qq.com/s/tr-SEjZp6fNVS6IrjIbCRg
太强了佬
相关推荐
士心凡_:进去后,问问题前先多用学城搜搜有没有解决文档,给mentor留个好印象。等你觉得他不在把你当实习生,而是当成同事的时候,和mt deeptalk一下,问一问有没有hc,没有的话再去冲一冲暑期
点赞 评论 收藏
分享
查看19道真题和解析