上海天数智芯-大模型推理引擎研发工程师招聘

岗位职责:

负责天数大模型推理技术的探索与研发,提升大模型在天数 GPGPU 上的推理性能:

1. 负责大模型推理引擎的架构设计与实现;

2. 负责大模型 server 的架构设计与实现;

3. 负责大模型推理通信库的设计及算法实现;

4. 负责大模型相关算子的实现及推理性能的整体优化;

5. 调研并支持大模型前沿算法;

任职资格:

编程基础(必须):

1. 熟悉 Python/C++ 编程(11标准及以上),了解常用数据结构及设计模式;

2. 熟悉深度学习编程框架,能够使用PyTorch 构建大模型推理 pipeline 并对模型中的核心模块进行高效实现;

3. 熟悉 CUDA 编程,了解常见算子的实现及优化手段;

大模型推理技术(至少满足两项):

1. 有 vLLM、TGI、SGLang、TensorRT-LLM等大模型推理框架的使用或优化经验;

2. 了解FlashAttention、PagedAttention、MoE、Chunked Prefill 等大模型核心技术;

3. 了解常见的大模型量化算法(如AWQ、GPTQ、SmoothQuant 等)及量化算子的实现;

4. 了解大模型通信算子(如Allreduce 等)及计算通信 overlap 实现;

5. 有分离式部署(PD 分离)开发经验。

感兴趣可以私聊我进一步了解~

#大模型##大模型招聘##大模型应用开发##大模型找工作##大模型算法工程师#
全部评论

相关推荐

查看9道真题和解析 简历中的项目经历要怎么写
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客企业服务