拼多多暑期LLM算法一面 45min
有面试过同岗的朋友欢迎评论区交流
1.pre train sft dpo是怎么做的
2.rmsnorm和layernorm的区别
3.lora的原理
4.怎样判断数据集的好坏
5.dpo的原理
6.dpo数据集里的chosen和rejected差别越大越好还是模糊一点好
7.手撕多叉树转成二叉树(递归+双指针)
1.pre train sft dpo是怎么做的
2.rmsnorm和layernorm的区别
3.lora的原理
4.怎样判断数据集的好坏
5.dpo的原理
6.dpo数据集里的chosen和rejected差别越大越好还是模糊一点好
7.手撕多叉树转成二叉树(递归+双指针)
全部评论
相关推荐
04-09 21:26
北京航空航天大学 算法工程师 点赞 评论 收藏
分享