滴滴26秋储-算法实习生(信贷方向)面经
一面(45min左右):
1.自我介绍
2.问两篇论文相关,巴拉巴拉说了一堆
3.平时用pytorch还是tf,答pytorch,接下来问pytorch怎么搭建模型什么的,评估模型的时候需要冻结哪些参数
4.Transformer连环炮
4.1 介绍一下transformer
4.2 多头注意力机制计算公式,如果要分8头,那么输入的维度有什么要求(答的可以被8整除)
4.3 FFN层的细节
4.4 多头注意力在训练的过程中,如何解决不同头参数趋同的问题(感觉是开放题目,答的不是很好)
4.5 LN和BN的区别,在训练和评估中有什么区别
4.6 post-LN和pre-LN
5.项目用了LoRA,介绍一下LoRA
6.矩阵的秩的概念,在深度学习中有什么意义
7.第二篇论文用了GCN,采样邻居的策略是什么?GAT、GraphSAGE有了解吗
8.DeepSeek R1的参数量,用的什么硬件(答用的蒸馏模型,GPU用的A100,没条件去微调原始模型)
9.手撕最长递增子序列
二面(30min):
1.自我介绍
2.项目中有遇到什么困难吗
3.介绍两个项目,担任什么角色,用到什么评估指标
4.介绍论文相关内容
5.平时用过树模型、因果推断什么的吗
6.手撕还是最长递增子序列(但是这次要求用python写,一面用java做的)
面试官的建议:动手能力挺强的,但是项目不能完成就可以了,要注重评估指标和效果以及多去横向对比各种方法的优缺点。
#滴滴##面经#