字节大模型算法 暑期实习 二面分享
被横向挂了,希望发出来对大家有帮助!
1.特征怎么筛选的
2.怎么构建离散和连续的特征
3.cot数据怎么构建筛选的
4.为什么要用sft和rlhf
5.grpo gspo dapo区别,为什么选择
代码:非负整数列表拼接最大数
1.特征怎么筛选的
2.怎么构建离散和连续的特征
3.cot数据怎么构建筛选的
4.为什么要用sft和rlhf
5.grpo gspo dapo区别,为什么选择
代码:非负整数列表拼接最大数
全部评论
相关推荐
查看18道真题和解析