阶跃星辰大模型算法实习面经 好难

发点面经攒攒人品~~
八股拷打
RL相关:
1.GAE是什么?
2.蒙特卡洛模拟和时序差分估计的区别?
3.偏差和方差是什么?
4.GRPO的优势值是什么?怎么算?baseline是什么?
5.RL训练MoE架构时的问题?怎么改进?问GSPO?
6.DeepSpeed框架了解吗?
7.Adam的公式是什么?
8.Adam一阶矩、二阶矩和梯度更新是怎么算的?
计算机基础:
1.指针是什么?
2.指针的长度是多少?
3.考了一道指针的算法题,关于赋值的。
4.BF16和FP16的区别?
5.bit和byte的关系
6.什么是时间复杂度?
7.GPU死锁是什么?
8.排序算法的一般的时间复杂度,并举例几个排序算法
9.介绍一下快排,什么时候出现最差情况?为什么一般不会出现最差的情况?
10.什么是动态规划?举个经典例子
全部评论

相关推荐

继续来分享下之前的面经~欢迎友好讨论,信息共享1.什么是大语言模型的涌现能力?目前对该现象的研究有哪些发现?2.什么是 Embedding?词嵌入和句嵌入有何不同?3.大语言模型中的 Tokenization 是如何工作的?不同模型的分词算法有何差异?4.简述大语言模型中的 Prompt Engineering 技巧,如何设计有效的提示词提升模型输出质量?5.对比 Zero-Shot、Few-Shot 和 In-Context Learning,它们在大语言模型中的应用场景和局限性分别是什么?6.什么是 LoRA?它在大语言模型微调中的优势和原理是什么?7.大语言模型的 RLHF 训练流程是什么?它存在哪些潜在风险?8.介绍一下大语言模型中的知识蒸馏,它如何用于压缩模型体积?9.DeepSeek 优化了哪些?为什么不用 PPO,而是用 GRPO?10.对比大语言模型的增量推理和传统推理方式,增量推理的优势和实现难点是什么?11.大语言模型在推理时出现幻觉现象的原因是什么?有哪些缓解方法?12.大语言模型的长文本处理能力有限,目前有哪些技术可以缓解这一问题?13.什么是大语言模型的上下文窗口?扩展上下文窗口对模型性能有何影响?14.目前多模态大语言模型是如何融合文本与图像信息的?15.如何评估大语言模型的性能?常见的评测指标和基准数据集有哪些?16.单个 LLM 能否帮助用户完成完整行程规划,比如从出行到酒店都订好票?
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务