百度大模型算法实习二面 50min
被横向挂了,希望发出来对大家有帮助!
1.实习拷打
2.介绍项目
3.chunk怎么切的
4.数据集的处理
5.训练参数设置
6.lora的原理
7.为什么主流大模型都是decoder,而不用encoder
8.为什么带think的推理模型,输出会更准确?
9.手撕:按要求切割一段话
1.实习拷打
2.介绍项目
3.chunk怎么切的
4.数据集的处理
5.训练参数设置
6.lora的原理
7.为什么主流大模型都是decoder,而不用encoder
8.为什么带think的推理模型,输出会更准确?
9.手撕:按要求切割一段话
全部评论
相关推荐
点赞 评论 收藏
分享