字节算法凉经
标注成本是多少
怎么确保标注的训练集是高质量
验证集的类别分布是什么
问实习项目有什么优化思路
为什么few shot可以提高模型输出表现
FAISS的原理
知识库怎么更新?
为什么不直接用相似度召回?而是过一遍大模型?
PPO和GRPO的区别?
为什么GRPO的kl 在loss中
PPO中每个模型解释
怎么确保标注的训练集是高质量
验证集的类别分布是什么
问实习项目有什么优化思路
为什么few shot可以提高模型输出表现
FAISS的原理
知识库怎么更新?
为什么不直接用相似度召回?而是过一遍大模型?
PPO和GRPO的区别?
为什么GRPO的kl 在loss中
PPO中每个模型解释
全部评论
相关推荐
查看17道真题和解析