不要给我
1 2

相关推荐

职位名称:图编译器开发工程师工作地点:杭州职位描述:我们正在寻找一位对深度学习编译器和 AI 加速器有深刻理解的图编译器开发与优化工程师。你将负责构建和优化从 PyTorch 到自研 NPU 的端到端图编译流程,确保模型在转换后精度无损、性能卓越、资源高效。工作涵盖前端图提取、中间表示(IR)优化、NPU 算子映射、量化支持、图调度及性能调优,是连接算法模型与底层硬件的关键桥梁。主要职责:1.设计并实现从 PyTorch(含 Dynamo/TorchScript)到内部 IR 的高保真图提取与转换流程;2.开发面向 NPU 架构的图级优化策略(如算子融合、内存复用、常量折叠、布局转换等);3.实现 NPU 原生算子的注册、匹配与替换机制,确保语义等价与数值精度一致;4.支持 FP16/BF16/FP8/FP4等混合精度推理,保障量化前后模型精度对齐;5.与 NPU 算子团队协作,定义高效算子接口,推动图-算子协同优化;6.构建自动化测试框架,覆盖图转换正确性、数值精度、性能回归等维度;7.针对大语言模型(LLM)、视觉模型等典型 workload 进行端到端编译 pipeline 优化。任职要求:必备条件:1.计算机科学、电子工程或相关专业硕士及以上学历;2.精通 C++ 和 Python,具备扎实的系统软件开发能力;3.深入理解深度学习计算图、执行调度等核心概念;4.有 PyTorch 图捕获(如 TorchDynamo)相关开发经验;5.熟悉主流深度学习编译器框架(如 TVM、MLIR);6.具备模型精度调试与数值一致性验证经验(如使用 torch.allclose、逐层比对等);7.了解 NPU/GPU 等 AI 加速器的基本架构与执行模型。加分项:1.有从 PyTorch 到专用硬件(如 NPU、TPU)的完整编译部署经验;2.熟悉 MLIR 方言设计、Pass 开发及 Lowering 流程;3.参与过大模型(如 Llama、Qwen、Stable Diffusion)的编译或部署优化;4.了解量化感知训练(QAT)或后训练量化(PTQ)流程;5.在 MLSys、OSDI、ASPLOS、NeurIPS Systems Track 等会议发表过相关成果。不光是图编译哦,有其他岗位的也可以联系我!
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
2025-12-20 08:00
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务