字节大模型应用面经

  • 简历项目问答
  • PPT解析优化还有什么优化
  • agent调用工具不正确怎么办
  • 采用sft或者强化学习怎么来解决
  • ppo算法为什么有reward model 又有critic model
  • function call能力提升采用grpo的话奖励函数怎么设计?除了结果奖励和可以怎么设计过程奖励

全部评论

相关推荐

不愿透露姓名的神秘牛友
09-24 09:28
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务