🍓一面时长约50min,面试官很和蔼,体验感还不错。1.面试官先简单介绍了下团队,然后是自我介绍;2.拷打了一下项目和论文;3.为什么多头注意力能提升表达能力?4.为什么要在大模型中使用 RMSNorm ?和 LayerNorm 有什么差异?5.LoRA和 PromptTuning 有何区别,分别适用于什么场景?6.模型微调时遇到过过拟合吗?怎么处理的?7.大模型推理时的加速思路?8.KV Cache 是怎么起作用的?为什么对长上下文推理很关键?算法题手撕:字符串的全排列。二叉树序列化与反序列化。✅面试感受:整体提问节奏比较平稳,面试官很有亲和力,有的地方卡住了还会给提示。🍓二面时长约40min,主要是针对简历进行深挖。1.自我介绍。2.深挖项目,针对项目思路不断追问。3.大模型生成内容如何做去重过滤?4.如果词表特别大(10w+ token ), Softmax 加速通常有哪些实现?5.如果要在中文领域做 Instruction Tuning ,需要注意哪些数据问题?6.反问✅面试感受:二面的氛围和一面截然不同,面试官提问非常犀利,没有太多套路问题,并且对细节很关注。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。