京东大模型算法一面-校招面经

1.项目拷打为主
2.项目中的OCR怎么做的,为什么用大模型做
3.后训练的数据规模有多少?数据集是自己构建的吗
4.数据清洗采用了什么策略
5.OCR如何处理复杂表格
6.微调前后准确率对比
7.Badcase有哪些,占比怎么样
8.为什么用GRPO不用DPO
9.什么任务适合DPO
10.模型微调用的是全参微调还是lora微调,为什么这么选
11.Lora微调的阿尔法和rank是怎么选择的,对模型的影响分别是怎么样的
12.GRPO奖励怎么设计的
13.是否做过消融实验
14.讲讲react思想
15.讲讲agent中的反思模块逻辑
16.Agent中数据是怎么交互的
全部评论

相关推荐

评论
3
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务