大模型算法岗实习面经 攒人品
继续来分享下之前的面经~欢迎友好讨论,信息共享
1. multi-head attention
2. 1D RoPE
3. 前向传播反向传播numpy推导实现
4. KL_divergence手撕
5. 损失函数手撕
6. 梯度下降法求解某个给定函数的极值点
7. Causal Conv(在VideoVAE中最主流的技术,包括3DConv和2+1D Conv)
8. 手撕Diffusion
1. multi-head attention
2. 1D RoPE
3. 前向传播反向传播numpy推导实现
4. KL_divergence手撕
5. 损失函数手撕
6. 梯度下降法求解某个给定函数的极值点
7. Causal Conv(在VideoVAE中最主流的技术,包括3DConv和2+1D Conv)
8. 手撕Diffusion
全部评论
相关推荐
