腾讯混元大模型面经
1.自我介绍
2.主要介绍实习内容
1.整体项目背景,其中第一个SFT工作的motivation,目标要求
a.我主动从此起手的,因为业务背景与动机真的很重要
b.背景会让面试官知道你是在什么样的背景下展开的,体现你对业务的整体理解;
c.动机体现你知道为什么要做,可以说工作都是为了解决现存的卡点,这点能体现你的hold与自主思
考,而不是只会接活就干
2,详细介绍第一个SFT工作,主要是我在讲,中间穿插细节询问
a.你的数据是怎么构造的,其中特殊形式是什么样的 b,会有多少的人工标注参与,最终量级有多大
c.你用的是Qwen3的小模型SFT,它分为推理/非推理模式,你怎么实现的非推理微调 d.顺着拷问原理,Qwen3的Rope原理
e.只做了SFT,没做后续训练是吧,最后有对模型做量化吗
f,有对比过prompt直出的效果吗,差距有多少(业务就是这样,方法越简单,效果能达标就行)
3.手撕 最长公共子序列(二维动态规划)
4.反问当前组内工作内容,元宝组内的