字节豆包大模型二面-日常实习

1.项目介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构
4.了解过哪些模型训练推理优化的方法
5.为什么有了 SFT 之后还需要 RLHF
6 .PPO 和 DPO 的主要思想是什么
7.代码:23.合并 K 个升序链表
全部评论

相关推荐

合适才能收到offe...:@创作小队长 给小助手点儿惩罚,小助手天天摸鱼
摸鱼被leader发现了...
点赞 评论 收藏
分享
烤点老白薯:他第二句话的潜台词是想让你帮他点个瑞幸或者喜茶啥的
mt对你说过最有启发的一...
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务