滴滴大模型三面总结
1️⃣一面
1. Self-Attention的原理
2. LLM 编码器和解码器的特点
3. 常用的开源大模型
4. 都做过什么技术(罗列,没有深挖)
5. 对强化学习的了解
手撕一道力扣简单
反问组里做什么工作
2️⃣二面
1. 让挑一个自己最拿手的项目介绍
2. 数据蒸馏的方法
3. 实践过程中有什么值得注意的点
4. QWEN2的架构和训练方式
5. PPO DPO GRPO的区别,几个强化学习的损失函数
6. 自监督学习怎么做
无手撕,简单反问
3️⃣三面
1. 如何防止毁灭性遗忘
2. 大模型如果应用到具体场景
3. 现在大模型应用的主流范式
4. 为什么用GRPO而不是SFT
5. 一道数学题
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
1. Self-Attention的原理
2. LLM 编码器和解码器的特点
3. 常用的开源大模型
4. 都做过什么技术(罗列,没有深挖)
5. 对强化学习的了解
手撕一道力扣简单
反问组里做什么工作
2️⃣二面
1. 让挑一个自己最拿手的项目介绍
2. 数据蒸馏的方法
3. 实践过程中有什么值得注意的点
4. QWEN2的架构和训练方式
5. PPO DPO GRPO的区别,几个强化学习的损失函数
6. 自监督学习怎么做
无手撕,简单反问
3️⃣三面
1. 如何防止毁灭性遗忘
2. 大模型如果应用到具体场景
3. 现在大模型应用的主流范式
4. 为什么用GRPO而不是SFT
5. 一道数学题
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
李橙子:有机会还是挺好的
点赞 评论 收藏
分享
点赞 评论 收藏
分享