阿里高德大模型算法实习一面 55min

1.讲一下实习期间做的工作
2.讲一下Dense 模型和 MoE 模型的区别、优缺点及参数上的比较
3.MoE模型专家的负载不均衡问题如何解决?
4.如何通过修改损失函数来解决负载均衡问题?
5.具体可以使用哪些损失函数解决负载均衡问题?
6.选一个 RLHF 方法来讲解(PPO, GRPO, DPO)
7.PPO有几个模型,每个模型的作用,以及哪些模型需要训练,哪些模型不需要训练
8.为什么要进行 RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)
9.介绍一下 Attention 机制数学原理、直觉原理以及计算公式的计算过程
10.什么是微调、微调的原理
11.为什么微调会有效果?
12.为什么不做全量微调?
13.介绍一下LoRA 微调及其如何减少训练的参数

14.算法题(两道题)
1.计算二叉树的深度
2.计算给定二叉树的最大路径和
写出来了并测试通过
全部评论
大佬,你双非本怎么这么多大厂算法岗面试
点赞 回复 分享
发布于 01-01 01:27 湖南

相关推荐

评论
2
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务