阶跃星辰大模型算法实习一面

1.实习介绍+项目吟唱

2.八股吟唱(部分不记得了)近20分钟
2.1 RL相关:
1.GAE是什么?
2.蒙特卡洛模拟和时序差分估计的区别?
3.偏差和方差是什么?
4.GRPO的优势值是什么?怎么算?baseline是什么?
5.RL训练MoE架构时的问题?怎么改进?问GSPO?
6.DeepSpeed框架了解吗?
7.Adam的公式是什么?
8.Adam一阶矩、二阶矩和梯度更新是怎么算的?

2.2 计算机基础:
1.指针是什么?
2.指针的长度是多少?
3.考了一道指针的算法题,关于赋值的。
4.BF16和FP16的区别?
5.bit和byte的关系
6.什么是时间复杂度?
7.GPU死锁是什么?
8.排序算法的一般的时间复杂度,并举例几个排序算法
9.介绍一下快排,什么时候出现最差情况?为什么一般不会出现最差的情况?
10.什么是动态规划?举个经典例子
全部评论

相关推荐

01-30 09:45
燕山大学 Java
喵_coding:这种直接跑就完事了 哪有毕业了才签合同 任何offer和三方都没有的
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务