滴滴26秋储-算法实习生(信贷方向)面经

一面(45min左右):

1.自我介绍

2.问两篇论文相关,巴拉巴拉说了一堆

3.平时用pytorch还是tf,答pytorch,接下来问pytorch怎么搭建模型什么的,评估模型的时候需要冻结哪些参数

4.Transformer连环炮

4.1 介绍一下transformer

4.2 多头注意力机制计算公式,如果要分8头,那么输入的维度有什么要求(答的可以被8整除)

4.3 FFN层的细节

4.4 多头注意力在训练的过程中,如何解决不同头参数趋同的问题(感觉是开放题目,答的不是很好)

4.5 LN和BN的区别,在训练和评估中有什么区别

4.6 post-LN和pre-LN

5.项目用了LoRA,介绍一下LoRA

6.矩阵的秩的概念,在深度学习中有什么意义

7.第二篇论文用了GCN,采样邻居的策略是什么?GAT、GraphSAGE有了解吗

8.DeepSeek R1的参数量,用的什么硬件(答用的蒸馏模型,GPU用的A100,没条件去微调原始模型)

9.手撕最长递增子序列

二面(30min):

1.自我介绍

2.项目中有遇到什么困难吗

3.介绍两个项目,担任什么角色,用到什么评估指标

4.介绍论文相关内容

5.平时用过树模型、因果推断什么的吗

6.手撕还是最长递增子序列(但是这次要求用python写,一面用java做的)

面试官的建议:动手能力挺强的,但是项目不能完成就可以了,要注重评估指标和效果以及多去横向对比各种方法的优缺点。

#滴滴##面经#
全部评论

相关推荐

昨天 12:44
已编辑
金山云_后端开发(实习员工)
点赞 评论 收藏
分享
评论
4
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务