字节 抖音电商大模型多模态面经 1h

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.sft阶段用的什么模型,数据来源,如何做数据处理,用的什么框架
3.ppo如何做的详细介绍,包括数据,怎么训练奖励模型,每个模型的损失什么样子的,在几张卡上做的训练
4.dpo训练流程,为什么ppo和dpo你都用了,有什么区别,有没有做对比试验
5.怎么评估你微调之后模型有提升
6.ppo为什么效果会比dpo强,怎么理解多轮dpo会有提升
7.项目中创新点外代码中怎么实现的,详细讲讲,消融实验怎么做的
8.整个项目你觉得哪里还有需要提升的地方,有没有新的想法,未来打算怎么做
八股部分
9.深度学习相关知识,讲几种优化器
10.讲MHA原理
11.GRPO原理
12.Lora原理,r大小对模型训练的影响
13.手撕
编辑距离(动态规划
14.vit训练原理
15.clip训练原理
全部评论

相关推荐

月入泉:假的,要你简历,然后说你简历的不足,让你报班的
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务