面壁智能大模型一面

手撕:MHA 自我介绍+项目提问约30分钟 涉及八股: Sft的损失函数怎样计算 grpo相对于ppo的改进 grpo的缺点以及改进算法 介绍几种并行训练方式(tp.pp等)哪一种最常用 训练的前向和后向过程中有哪些中间值是fp32,哪些是fp16 场景题: 一个2b的小模型,要想提高其在运算方面的数学能力,怎么设计训练方式?
全部评论

相关推荐

故事和酒66:小米现在校招很多都是在高校搞小米训练营,然后直接挑人,大四就去实习,所以实际上校招总名额是变少了的。同学211本无经验经过两周培训直接签了
秋招,不懂就问
点赞 评论 收藏
分享
11-17 23:00
南昌大学 Java
我要娶个什么名:10元一天 0元提成😂
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务