同花顺金融大模型算法一面面经

1. 项目和八股

1.RAG如何做rerank的
2.LoRA参数计算 比如给你一个7B的模型  在优化器这块如何分配
3.了解强化学习的什么算法   强化学习最新的po算法
4.grpo如果对于这个数据 训练出来的一组score都是0或者1  这时候应该怎么办
5.agent的几大部分
6.agentic rl
7.gui agent   code agent
8.了解软件工程相关的吗  AI for se

2.无手撕
3.反问业务,做的 金融领域 agent 方向,偏开发
全部评论
grpo如果对于这个数据 训练出来的一组score都是0或者1 咋回复的
点赞 回复 分享
发布于 02-07 15:33 湖南

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务