大模型Agent算法一面实习-快手
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.MoE模型微调显存计算
3.从数学角度解释为什么attention要除以根号下d_k?如果不开根号行不行
4.多模态大模型的架构一般有哪些
5.PPO有几个模型?
6.GRPO和PPO有什么区别?
7.拷打论文
1.项目拷打
2.MoE模型微调显存计算
3.从数学角度解释为什么attention要除以根号下d_k?如果不开根号行不行
4.多模态大模型的架构一般有哪些
5.PPO有几个模型?
6.GRPO和PPO有什么区别?
7.拷打论文
全部评论
相关推荐
点赞 评论 收藏
分享
查看14道真题和解析 点赞 评论 收藏
分享
