阿里控股大模型算法一面凉经 面麻了
攒人品中,祝大家都能拿到满意的Offer!
1.实习拷打
2.实习项目:重点问了数据处理的步骤,配比,怎么评判质量
3.实习项目:GUI-Agent的思考,介绍技术,怎么做的异步训练,怎么评判完成等等
4.讲一下PPO和GRPO
5.知道哪些attention变体,讲一下。问知不知道linear attention,qwen3.5和minimax2.5都用了
6.PPO和GRPO的token前后奖励一不一样,这个我实在不明白,说不太懂这个地方
7.vibe coding
1.实习拷打
2.实习项目:重点问了数据处理的步骤,配比,怎么评判质量
3.实习项目:GUI-Agent的思考,介绍技术,怎么做的异步训练,怎么评判完成等等
4.讲一下PPO和GRPO
5.知道哪些attention变体,讲一下。问知不知道linear attention,qwen3.5和minimax2.5都用了
6.PPO和GRPO的token前后奖励一不一样,这个我实在不明白,说不太懂这个地方
7.vibe coding
全部评论
相关推荐
点赞 评论 收藏
分享