美团大模型算法校招面经 攒人品
八股
1.bf16 和 float16 的区别?各占多少位?训练中如何选择?
2.DeepSpeed Zero 各阶段分别做了哪些优化?
3.如何估算 LLaMA-7B 模型推理时的显存占用?
4.Prefix LM、Causal LM、Encoder-Decoder 三类架构的适用场景与优缺点?
5.Qwen 或 DeepSeek 技术报告中提到的关键创新点有哪些?例如: RoPE 外推、MoE
6.PPO/GRPO 微调后,如何防止模型在分布外(OOD)问题上性能崩塌?
7.是否自己实现过 RLHF 流程?不用框架能否手写 PPO 核心逻辑?
8.模型部署用了什么框架(vLLM/TGI/自研)?如何优化推理延迟和吞吐?
9.未来希望专注大模型哪个方向?例如:对齐 / 推理加速 / 长上下文
手撕:
K 个一组翻转链表(LeetCode 25)
1.bf16 和 float16 的区别?各占多少位?训练中如何选择?
2.DeepSpeed Zero 各阶段分别做了哪些优化?
3.如何估算 LLaMA-7B 模型推理时的显存占用?
4.Prefix LM、Causal LM、Encoder-Decoder 三类架构的适用场景与优缺点?
5.Qwen 或 DeepSeek 技术报告中提到的关键创新点有哪些?例如: RoPE 外推、MoE
6.PPO/GRPO 微调后,如何防止模型在分布外(OOD)问题上性能崩塌?
7.是否自己实现过 RLHF 流程?不用框架能否手写 PPO 核心逻辑?
8.模型部署用了什么框架(vLLM/TGI/自研)?如何优化推理延迟和吞吐?
9.未来希望专注大模型哪个方向?例如:对齐 / 推理加速 / 长上下文
手撕:
K 个一组翻转链表(LeetCode 25)
全部评论
相关推荐

好未来成长空间 68人发布
查看8道真题和解析