NLP算法面经14
10.15 携程 NLP(2+1)
1. 项目+实习
2. Lora原理以及初始化
3. Lora参数含义
4. Deepspeed三阶段
5. 强化学习框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型温度系数作用,topk和p的区别
9. bert的位置编码以及ROPE
10. 深入探讨Deepseek的技术
11. 深入探讨MOE和Dense模型
12. 代码题:接雨水
#大模型# #多模态人工智能# #nlp# #互联网大厂# #互联网大厂实习# #面经# #携程#
1. 项目+实习
2. Lora原理以及初始化
3. Lora参数含义
4. Deepspeed三阶段
5. 强化学习框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型温度系数作用,topk和p的区别
9. bert的位置编码以及ROPE
10. 深入探讨Deepseek的技术
11. 深入探讨MOE和Dense模型
12. 代码题:接雨水
#大模型# #多模态人工智能# #nlp# #互联网大厂# #互联网大厂实习# #面经# #携程#
全部评论
Lora参数详解下
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享