NLP算法面经14
10.15 携程 NLP(2+1)
1. 项目+实习
2. Lora原理以及初始化
3. Lora参数含义
4. Deepspeed三阶段
5. 强化学习框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型温度系数作用,topk和p的区别
9. bert的位置编码以及ROPE
10. 深入探讨Deepseek的技术
11. 深入探讨MOE和Dense模型
12. 代码题:接雨水
#大模型# #多模态人工智能# #nlp# #互联网大厂# #互联网大厂实习# #面经# #携程#
1. 项目+实习
2. Lora原理以及初始化
3. Lora参数含义
4. Deepspeed三阶段
5. 强化学习框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型温度系数作用,topk和p的区别
9. bert的位置编码以及ROPE
10. 深入探讨Deepseek的技术
11. 深入探讨MOE和Dense模型
12. 代码题:接雨水
#大模型# #多模态人工智能# #nlp# #互联网大厂# #互联网大厂实习# #面经# #携程#
全部评论
Lora参数详解下
相关推荐
查看3道真题和解析 点赞 评论 收藏
分享
先锋战士:说得很真诚。鄙视链自古有之,学历,家庭背景,财富,权利。从小有之,小学羡慕那些当班委的,中学羡慕那些学生会的,高中羡慕尖子班拿教学金的,大学羡慕高绩点,毕业了羡慕进大厂的。工作了,又羡慕高职级的,再后来又羡慕别人早早结婚的。我想表达的观点很简单,无论是华为od还是百度,都是经历,没有孰高孰低,为了抵达下一个风景,总会付出更多东西,但不就是人生吗?正如登山,每个阶段的山,都要想办法攀登,在博主的文字中,见到了坚持和积极寻找问题解决办法的心态 点赞 评论 收藏
分享
点赞 评论 收藏
分享
