联通大模型算法 26校招一面
发点面经攒攒人品~
1.项目拷打
2.现在主流大模型架构有什么变化?
3.grpo的改进方法有哪些?了解gspo吗?
4.transformer结构介绍?
5.实习拷打
6.deepseek r1有的什么注意力优化?
7.有了解什么kv优化方法吗?
8.code:手撕mha,进一步问在哪加masked矩阵。
1.项目拷打
2.现在主流大模型架构有什么变化?
3.grpo的改进方法有哪些?了解gspo吗?
4.transformer结构介绍?
5.实习拷打
6.deepseek r1有的什么注意力优化?
7.有了解什么kv优化方法吗?
8.code:手撕mha,进一步问在哪加masked矩阵。
全部评论
相关推荐
查看11道真题和解析