11.14字节秋招豆包大模型算法二面
二面
1.自我介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder-only 成为大模型的主流架构,相比于 Encoder-Decoder的架构好在哪里
4.讲-下 ROPE ,目目前常用的位置编码还有哪些,ROPE 有什么优点
5.为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么,DPO 相比 PPO的 RLHF 做了哪些改进,除此之外还知道哪些 RL算法
7. 代码:23.合并K个升序链表
1.自我介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder-only 成为大模型的主流架构,相比于 Encoder-Decoder的架构好在哪里
4.讲-下 ROPE ,目目前常用的位置编码还有哪些,ROPE 有什么优点
5.为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么,DPO 相比 PPO的 RLHF 做了哪些改进,除此之外还知道哪些 RL算法
7. 代码:23.合并K个升序链表
全部评论
相关推荐


海康威视公司福利 1272人发布