3.7 小米算法实习生(大模型)一面(50min)

3.7 小米算法实习生(大模型)一面(50min)
无脸男
自我介绍
项目主要想完成的目标
论文有哪些idea
介绍PPO算法
为什么PPO算法要用优势函数来评估,为什么不能直接用reward反馈(拷打到死)
GRPO算法
优势函数是什么的优势
GAE广义优势的缺点
介绍Qlora,对什么进行4bit量化,lora初始矩阵是什么,lora矩阵的量化
撕题:数组中找出第k大的数

无反问
全部评论
佬是项目里就有rl吗
点赞 回复 分享
发布于 03-13 13:52 天津

相关推荐

嵌入式的小白:这种简历没反馈的,就要看简历的原因了,肯定是简历和你投递的岗位不匹配的 1.看看招聘公司的岗位描述,筛选出和你匹配的,或者你想去从事的岗位,或者就是对你这个方向的岗位进行分类 2.根据1的情况,针对性的写简历,遇到不了解的,问问学长学姐,把简历一定要弄好 3.开始投递,这个时候个大平台都投,同时联系学长学姐,看有没有能给你内推的 4.根据前面的分析,整理出不同方向都会涉及到的点,先把这部分掌握好,面试会用到的 5.简历中写的项目啥的,也要掌握,面试肯定会问项目的 你这个行业我不了解,只能简单的说这么多了
牛客在线求职答疑中心
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
1
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务