拼多多暑期LLM算法一面 45min

有面试过同岗的朋友欢迎评论区交流
1.pre train sft dpo是怎么做的
2.rmsnorm和layernorm的区别
3.lora的原理
4.怎样判断数据集的好坏
5.dpo的原理
6.dpo数据集里的chosen和rejected差别越大越好还是模糊一点好
7.手撕多叉树转成二叉树(递归+双指针)
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务