阿里大模型算法暑期实习面经分享

继续来分享下最近的面经~欢迎友好讨论,信息共享
1.项目背景
2.要解决的问题
3.要解决问题的难点
4.技术方案选型
5.最终如何确定技术方案
6.Qwen3-VL embedding 是怎么做的
7.是怎么提取图片的
8.用的什么提取器
9.最终怎么嵌入到文本里
10.怎么定义 DPO 训练集是高质量的
11.DPO 训练数据量是怎么确定的
12.数据量确定是拍脑袋,还是有原则
13.为什么不用 SFT
14.SFT 数据质量要求高体现在哪些方面
15.如果现在用 SFT 去解决这个问题,从理论上能不能解决
16.为什么不用 GRPO 解决,而是选择 DPO
17.说一下目前强化学习的问题和解决思路
全部评论

相关推荐

查看28道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务