阿里巴巴大模型算法一面-实习面经
1.实习经历穿插具体介绍
2.bceloss公式介绍用pe,优势在哪里
3.粗排有没有和精排有什么交互信息
4.序列建模的基线模型是什么
5.Linux常用命令有哪些,如何用Linux命令在两服务器间传数据
6、如何降低KV cache
7、讲讲DeepSeek中的MLA
8.讲讲最开始的自注意力机制发展到当今的一个优化路线
9.手撕最长公共子串
2.bceloss公式介绍用pe,优势在哪里
3.粗排有没有和精排有什么交互信息
4.序列建模的基线模型是什么
5.Linux常用命令有哪些,如何用Linux命令在两服务器间传数据
6、如何降低KV cache
7、讲讲DeepSeek中的MLA
8.讲讲最开始的自注意力机制发展到当今的一个优化路线
9.手撕最长公共子串
全部评论
相关推荐
点赞 评论 收藏
分享
查看15道真题和解析 点赞 评论 收藏
分享
点赞 评论 收藏
分享