WXG 大模型算法 实习面经
发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.实习介绍
2.当时线上用的什么模型?这个成本高不高?
3.支持了多少用户量?DAU是什么量级?
4.AB实验细节
5.微调语料有做类型分类、样本分布分析或偏好调整吗?
6.微调用的什么框架?
7.反推思考过程(COT)是怎么得到的?有没有发现问题?
8.回答出来的判断标准是什么?是人工还是机器判断?
9.RL训练用了多少节点,什么框架?
10.SFT数据量是多少?RL数据量是多少?11.解释一下GSPO相比GRPO的变化,公式。12.如果同事训GRPO时发现loss是0,你觉得正常吗?如果不正常,可能原因和解决方案是什么?
代码:二维前缀和
1.实习介绍
2.当时线上用的什么模型?这个成本高不高?
3.支持了多少用户量?DAU是什么量级?
4.AB实验细节
5.微调语料有做类型分类、样本分布分析或偏好调整吗?
6.微调用的什么框架?
7.反推思考过程(COT)是怎么得到的?有没有发现问题?
8.回答出来的判断标准是什么?是人工还是机器判断?
9.RL训练用了多少节点,什么框架?
10.SFT数据量是多少?RL数据量是多少?11.解释一下GSPO相比GRPO的变化,公式。12.如果同事训GRPO时发现loss是0,你觉得正常吗?如果不正常,可能原因和解决方案是什么?
代码:二维前缀和
全部评论

感觉问的还挺多的啊
相关推荐
查看20道真题和解析