NLP算法面经16

10.17 蚂蚁 NLP (2+1)
1. 项目+实习
2. 强化学习的发展历程
3. 多头注意力书写
4. Lora的优势
5. 对话的掩码方式,其次是整体计算?
6. deepspeed zero123区别,有没有看过显存占用
7. grpo比dpo和ppo优势在哪?
8. MLA相比GQA的优势?
9. Agent的看法?
10. 跨模态处理的有效方法?
11. Qwen2-VL的框架介绍?
#大模型# #算法# #互联网大厂# 面经 #nlp# 蚂蚁 #阿里# #互联网大厂实习#
全部评论

相关推荐

评论
1
4
分享

创作者周榜

更多
牛客网
牛客企业服务