小米算法实习 二面攒人品中

被横向挂了,希望发出来对大家有帮助!
1.实习拷打
2.sft时的消融实验是如何做的
3.有过强化学习经历吗
4.简单讲讲dpo算法
5.如何构建dpo的偏好数据集
6.在dpo训练时有什么值得讲讲的经验吗,对比过ppo和grpo的效果吗
7.有看过网上开源的数据集吗,你自己合成的数据比开源的好在哪里,为什么不用开源的
8.算法题:给你一组区间,如[[1,6],[2,10],[11,13],请你合并重复的区间并返回,比如这个case,返回[[1,10],[11,13]]
全部评论
感觉问的似乎不多啊
点赞 回复 分享
发布于 03-22 22:19 北京

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务