蚂蚁大模型llm算法日常实习面经
继续来分享下最近的面经攒攒人品~
1. 项目模型选型 qwen的技术报告
2. 场景下为什么选用DPO,卡和资源环境
3. 实验设计题:长文本预训练,设计实验找出 不同数据源 不同语料大小下 loss收敛和不收敛的原因
4. SFT和RL两阶段的意义
5. 看的工作,sota
6. 有什么想讲的 highlight的点 , 有什么想问的
1. 项目模型选型 qwen的技术报告
2. 场景下为什么选用DPO,卡和资源环境
3. 实验设计题:长文本预训练,设计实验找出 不同数据源 不同语料大小下 loss收敛和不收敛的原因
4. SFT和RL两阶段的意义
5. 看的工作,sota
6. 有什么想讲的 highlight的点 , 有什么想问的
全部评论
相关推荐
查看13道真题和解析