腾讯大模型实习一面 1h
继续来分享下之前的面经~欢迎友好讨论,信息共享
1.介绍一下如何筛选数据(大模型从哪几个维度),怎么确定模型筛选一定能和人工对齐?
2.GRPO/DAPO/GSPO介绍,怎么改进?
3.如何确定问题的难度?是有一个路由器还是分类器吗?如何保证路由的准确率?
4.R1输出的CoT过长是怎么解决的?
5.两阶段强化学习是怎么做的,区别是什么?
6.为什么用gemma-3,比较冷,考量的是什么
题目:逻辑题
1.介绍一下如何筛选数据(大模型从哪几个维度),怎么确定模型筛选一定能和人工对齐?
2.GRPO/DAPO/GSPO介绍,怎么改进?
3.如何确定问题的难度?是有一个路由器还是分类器吗?如何保证路由的准确率?
4.R1输出的CoT过长是怎么解决的?
5.两阶段强化学习是怎么做的,区别是什么?
6.为什么用gemma-3,比较冷,考量的是什么
题目:逻辑题
全部评论
相关推荐
查看11道真题和解析 点赞 评论 收藏
分享
查看22道真题和解析 点赞 评论 收藏
分享
03-12 21:22
门头沟学院 Java 从0到java大王:这就是大厂笔试题吗,感觉比平时刷的力扣难,要么是数学题要么是看着比较复杂的题,只会第一道题,第四道题暴力直接超市,二三看了会就放弃了
点赞 评论 收藏
分享