NLP算法面经14
10.15 携程 NLP(2+1)
1. 项目+实习
2. Lora原理以及初始化
3. Lora参数含义
4. Deepspeed三阶段
5. 强化学习框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型温度系数作用,topk和p的区别
9. bert的位置编码以及ROPE
10. 深入探讨Deepseek的技术
11. 深入探讨MOE和Dense模型
12. 代码题:接雨水
#大模型# #多模态人工智能# #nlp# #互联网大厂# #互联网大厂实习# #面经# #携程#
1. 项目+实习
2. Lora原理以及初始化
3. Lora参数含义
4. Deepspeed三阶段
5. 强化学习框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型温度系数作用,topk和p的区别
9. bert的位置编码以及ROPE
10. 深入探讨Deepseek的技术
11. 深入探讨MOE和Dense模型
12. 代码题:接雨水
#大模型# #多模态人工智能# #nlp# #互联网大厂# #互联网大厂实习# #面经# #携程#
全部评论
Lora参数详解下
相关推荐
点赞 评论 收藏
分享
11-03 18:30
湖南大学 游戏策划
嵌入式的小白:其实说句实话,这个福利背后是后一套逻辑的
1.公司食堂提供免费的早餐,但不会提供到比如10点,这样大家就会早点来公司
2.食堂提供宵夜,也是同样的道理,想让员工晚上加班
3.提供健身房,也是希望看能不能把大家吸引来周末加班
4.有宿舍的,这个宿舍一般不会很远的,缩短在路上的耗时,更多的时间就放在公司上了
巨人网络公司福利 91人发布 点赞 评论 收藏
分享
