小米算法实习 二面攒人品中
被横向挂了,希望发出来对大家有帮助!
1.实习拷打
2.sft时的消融实验是如何做的
3.有过强化学习经历吗
4.简单讲讲dpo算法
5.如何构建dpo的偏好数据集
6.在dpo训练时有什么值得讲讲的经验吗,对比过ppo和grpo的效果吗
7.有看过网上开源的数据集吗,你自己合成的数据比开源的好在哪里,为什么不用开源的
8.算法题:给你一组区间,如[[1,6],[2,10],[11,13],请你合并重复的区间并返回,比如这个case,返回[[1,10],[11,13]]
1.实习拷打
2.sft时的消融实验是如何做的
3.有过强化学习经历吗
4.简单讲讲dpo算法
5.如何构建dpo的偏好数据集
6.在dpo训练时有什么值得讲讲的经验吗,对比过ppo和grpo的效果吗
7.有看过网上开源的数据集吗,你自己合成的数据比开源的好在哪里,为什么不用开源的
8.算法题:给你一组区间,如[[1,6],[2,10],[11,13],请你合并重复的区间并返回,比如这个case,返回[[1,10],[11,13]]
全部评论
相关推荐
昨天 18:49
西北工业大学 Java 点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看4道真题和解析