字节 抖音电商大模型多模态面经 1h
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.sft阶段用的什么模型,数据来源,如何做数据处理,用的什么框架
3.ppo如何做的详细介绍,包括数据,怎么训练奖励模型,每个模型的损失什么样子的,在几张卡上做的训练
4.dpo训练流程,为什么ppo和dpo你都用了,有什么区别,有没有做对比试验
5.怎么评估你微调之后模型有提升
6.ppo为什么效果会比dpo强,怎么理解多轮dpo会有提升
7.项目中创新点外代码中怎么实现的,详细讲讲,消融实验怎么做的
8.整个项目你觉得哪里还有需要提升的地方,有没有新的想法,未来打算怎么做
八股部分
9.深度学习相关知识,讲几种优化器
10.讲MHA原理
11.GRPO原理
12.Lora原理,r大小对模型训练的影响
13.手撕
编辑距离(动态规划
14.vit训练原理
15.clip训练原理
1.项目拷打
2.sft阶段用的什么模型,数据来源,如何做数据处理,用的什么框架
3.ppo如何做的详细介绍,包括数据,怎么训练奖励模型,每个模型的损失什么样子的,在几张卡上做的训练
4.dpo训练流程,为什么ppo和dpo你都用了,有什么区别,有没有做对比试验
5.怎么评估你微调之后模型有提升
6.ppo为什么效果会比dpo强,怎么理解多轮dpo会有提升
7.项目中创新点外代码中怎么实现的,详细讲讲,消融实验怎么做的
8.整个项目你觉得哪里还有需要提升的地方,有没有新的想法,未来打算怎么做
八股部分
9.深度学习相关知识,讲几种优化器
10.讲MHA原理
11.GRPO原理
12.Lora原理,r大小对模型训练的影响
13.手撕
编辑距离(动态规划
14.vit训练原理
15.clip训练原理
全部评论
相关推荐
03-20 11:08
辽宁工程技术大学 软件测试 点赞 评论 收藏
分享
03-24 02:36
广东工业大学 C++ 点赞 评论 收藏
分享


