百度 文心大模型算法 实习一面
给我面没招了,感觉自己好菜、面试很难,还是要多多练习
1、项目拷打
2、DPO对齐训练的曲线是怎么样的,正例的概率会提升嘛
3、Deepseek-R1里面不仅推理能力很好,而且文采能力也很好,这个是个开放问题,如何让模型的文采能力也很好呢4、DPO如何解决回答过长的问题,除了正则5、开放问题:为什么现在大家都在关注于大模型的推理能力reasoning6、对于一个basemodel如何增强大模型的reasoning能力
7、模型选型时是否做定性定量对比abtest,客观数据验证文心性能不好了吗
1、项目拷打
2、DPO对齐训练的曲线是怎么样的,正例的概率会提升嘛
3、Deepseek-R1里面不仅推理能力很好,而且文采能力也很好,这个是个开放问题,如何让模型的文采能力也很好呢4、DPO如何解决回答过长的问题,除了正则5、开放问题:为什么现在大家都在关注于大模型的推理能力reasoning6、对于一个basemodel如何增强大模型的reasoning能力
7、模型选型时是否做定性定量对比abtest,客观数据验证文心性能不好了吗
全部评论
相关推荐
查看7道真题和解析