岗位职责 方向一:大模型极致性能优化,突破万卡级集群训练效率瓶颈,设计大模型的训练方案。方向二:大模型AI分布式系统核心特性开发,参与自研AI分布式系统的架构设计与模块开发,包括但不限于:分布式训练系统(自动并行/流水并行/模型并行),动态计算图优化与微分机制方向三:行业大模型训练全流程支撑,深入金融、运营商等行业场景,为客户提供,定制化训练方案设计,将客户需求反哺,提炼共性需求。岗位要求1. 计算机科学、机器学习、统计学、应用数学等相关专业。2. 熟悉Python/C++, 能够用相关语言进行程序开发。3. 熟悉深度学习,大模型训练基础原理,有模型训练经验优先。我们将一起:🔥 打造AI核武器级基础设施开发支持万亿参数大模型的训练AI分布式系统设计下一代自动并行/混合精度/容错算法为金融、医疗、自动驾驶等行业客户提供硬核AI解决方案加入我们,让中国AI基础设施不再被卡脖子!工作地:上海