字节豆包大模型二面-日常实习

1.项目介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构
4.了解过哪些模型训练推理优化的方法
5.为什么有了 SFT 之后还需要 RLHF
6 .PPO 和 DPO 的主要思想是什么
7.代码:23.合并 K 个升序链表
全部评论
感觉问的挺少的
点赞 回复 分享
发布于 2025-12-26 16:25 江西
豆包现在挺好,去实习很好
点赞 回复 分享
发布于 2025-12-21 23:49 北京

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务