26校招小红书大模型算法二面
1.八股:大模型框架了解哪些,介绍下vllm原理
2.八股:常用的LLM,讲解DeepSeek R1的训练流程和基本原理。
3.八股:讲讲MOE架构和Dense架构差异,在训练和推理方面
4.项目:介绍实习项目,项目中有没有做微调?
5.项目:DPO,PPO和GRPO的区别
6.项目:为什么PPO要用value baseline和GAE?它们如何让训练更稳定?
7.项目:为什么GRPO在训练MOE时会出问题?原因是啥,怎么改进策略
8.项目:GRPO的KL散度是什么?KL散度中超参数如何设计?
9.项目:阐述大模型的幻觉现象及抑制方法。
10.代码题:lc300 最长递增子序列
2.八股:常用的LLM,讲解DeepSeek R1的训练流程和基本原理。
3.八股:讲讲MOE架构和Dense架构差异,在训练和推理方面
4.项目:介绍实习项目,项目中有没有做微调?
5.项目:DPO,PPO和GRPO的区别
6.项目:为什么PPO要用value baseline和GAE?它们如何让训练更稳定?
7.项目:为什么GRPO在训练MOE时会出问题?原因是啥,怎么改进策略
8.项目:GRPO的KL散度是什么?KL散度中超参数如何设计?
9.项目:阐述大模型的幻觉现象及抑制方法。
10.代码题:lc300 最长递增子序列
全部评论
好难啊
看来背八股还是有必要的
相关推荐

查看15道真题和解析