字节豆包大模型二面-日常实习
1.项目介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构
4.了解过哪些模型训练推理优化的方法
5.为什么有了 SFT 之后还需要 RLHF
6 .PPO 和 DPO 的主要思想是什么
7.代码:23.合并 K 个升序链表
2.实习微调过Qwen2,你说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构
4.了解过哪些模型训练推理优化的方法
5.为什么有了 SFT 之后还需要 RLHF
6 .PPO 和 DPO 的主要思想是什么
7.代码:23.合并 K 个升序链表
全部评论
相关推荐
昨天 17:15
华东师范大学 运营 点赞 评论 收藏
分享
12-16 17:17
门头沟学院 产品经理 点赞 评论 收藏
分享
查看6道真题和解析