京东大模型算法一面-校招面经
1.项目拷打为主
2.项目中的OCR怎么做的,为什么用大模型做
3.后训练的数据规模有多少?数据集是自己构建的吗
4.数据清洗采用了什么策略
5.OCR如何处理复杂表格
6.微调前后准确率对比
7.Badcase有哪些,占比怎么样
8.为什么用GRPO不用DPO
9.什么任务适合DPO
10.模型微调用的是全参微调还是lora微调,为什么这么选
11.Lora微调的阿尔法和rank是怎么选择的,对模型的影响分别是怎么样的
12.GRPO奖励怎么设计的
13.是否做过消融实验
14.讲讲react思想
15.讲讲agent中的反思模块逻辑
16.Agent中数据是怎么交互的
2.项目中的OCR怎么做的,为什么用大模型做
3.后训练的数据规模有多少?数据集是自己构建的吗
4.数据清洗采用了什么策略
5.OCR如何处理复杂表格
6.微调前后准确率对比
7.Badcase有哪些,占比怎么样
8.为什么用GRPO不用DPO
9.什么任务适合DPO
10.模型微调用的是全参微调还是lora微调,为什么这么选
11.Lora微调的阿尔法和rank是怎么选择的,对模型的影响分别是怎么样的
12.GRPO奖励怎么设计的
13.是否做过消融实验
14.讲讲react思想
15.讲讲agent中的反思模块逻辑
16.Agent中数据是怎么交互的
全部评论
相关推荐
查看23道真题和解析