阿里控股大模型算法一面凉经 面麻了

攒人品中,祝大家都能拿到满意的Offer!
1.实习拷打
2.实习项目:重点问了数据处理的步骤,配比,怎么评判质量
3.实习项目:GUI-Agent的思考,介绍技术,怎么做的异步训练,怎么评判完成等等
4.讲一下PPO和GRPO
5.知道哪些attention变体,讲一下。问知不知道linear attention,qwen3.5和minimax2.5都用了
6.PPO和GRPO的token前后奖励一不一样,这个我实在不明白,说不太懂这个地方
7.vibe coding
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务