腾讯大模型算法岗面经
1.自我介绍及项目经历
2.如何增强模型的多轮对话能力?
3.介绍MoE (混合专家)架构核心优势。
4.阐述大模型训练与推理的完整流程。
5. 对比 LORA 微调 Qwen 模型两种微调方式的性能表现。
6.FlashAttention v1 和 v2 的主要改进点分别是什么?
7.CoT(Chain-of-Thought)训练数据是如何构造的?
8.当前主流的强化学习算法有哪些?
9.代码:LeetCode 22,实现“括号生成”问题。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
#互联网大厂# 大模型 #面经# 人工智能就业 #校
2.如何增强模型的多轮对话能力?
3.介绍MoE (混合专家)架构核心优势。
4.阐述大模型训练与推理的完整流程。
5. 对比 LORA 微调 Qwen 模型两种微调方式的性能表现。
6.FlashAttention v1 和 v2 的主要改进点分别是什么?
7.CoT(Chain-of-Thought)训练数据是如何构造的?
8.当前主流的强化学习算法有哪些?
9.代码:LeetCode 22,实现“括号生成”问题。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
#互联网大厂# 大模型 #面经# 人工智能就业 #校
全部评论
标记
相关推荐
点赞 评论 收藏
分享
查看9道真题和解析