首页 / 推理加速
#

推理加速

#
4122次浏览 15人互动
此刻你想和大家分享什么
热门 最新
点赞 评论 收藏
分享
2025-12-15 15:14
门头沟学院 C++
27 ai infra方向找实习求捞
已注销:拼多多记得这个方向不错吧
点赞 评论 收藏
分享
阿里云 AI Infra 实习生招聘
阿里云专有云iaas软硬结合AI创新team招实习啦,暑期实习可转正,简历直达leader核心方向,老板超nice,工作氛围好不卷,作息1075,base 北京/杭州/上海目前方向:1.  阿里自研ppu芯片 软硬协同优化2.  agentsandbox kata/firecracker/gvisor3. AI模型镜像链路加速,系统性能优化4. AI稳定性工程闭环对以上感兴趣的小伙伴们 直接+VVVV~X caoyifan1a2b---以下为官网 jd1.AI 训推系统级性能优化与组件化交付面向 LLM/VLM/VLA、智驾等场景,围绕训练与推理全链路开展性能分析与优化落地,产出可复用的软件组件/算子库/解决方案.典型优化方向:计算与访存瓶颈、显存/内存管理、KV Cache、长上下文、并行策略(TP/PP/DP/EP)、通信与网络(AllReduce/AllGather/AllToAll、RDMA)、数据与 I/O(DataLoader、checkpoint、存储带宽)。2.云原生 AI Runtime 与隔离(Kata / runD / Sandbox Runtime)负责 GPU 在 Kata Containers/沙箱容器中的高性能、安全隔离与可用性建设:GPU 直通/虚拟化、驱动与设备插件集成、容器镜像与运行时兼容。参与 sandbox runtime(containerd/CRI 体系)相关能力建设:资源隔离(cgroup/namespace/NUMA)、启动时延优化、稳定性与故障恢复、可观测性(metrics/tracing/logging)。与 Kubernetes 侧生态协同(Device Plugin、RuntimeClass、调度/拓扑亲和、弹性伸缩等),提升多租户环境下 GPU 利用率与 QoS。3.软硬件协同与异构算力适配深入结合硬件特性(计算单元、HBM/缓存层次、PCIe/NVLink/互联、编译器/运行时)制定协同优化方案,推进在训练/推理/云原生运行时侧的落地。构建 microbenchmark、性能模型与回归体系,快速定位瓶颈并指导组件演进。4.稳定性与工程闭环建设端到端与算子级 benchmark、自动化 profiling、CI 回归与精度/稳定性守护。定位并解决复杂问题:hang/crash、OOM、性能抖动、通信异常、GPU 设备异常、虚拟化/隔离环境下的兼容性问题。
点赞 评论 收藏
分享
2025-08-07 20:02
浙江大学 算法工程师
pdd主站搜推部门秋招提前批!大量HC
【校招内推-提前批次(结果不影响后续批次)】1.  服务端研发工程师内推链接:https://careers.pddglobalhr.com/campus/grad/detail?t=dYzPqsiDX5内推码:dYzPqsiDX52.  算法工程师内推链接:https://careers.pddglobalhr.com/campus/grad/detail?t=qpV8psah6w内推码:qpV8psah6w通过上述链接投递计入内推,内推简历优先筛选~【社招内推】社招的大佬们可以发简历到邮箱📪:**********📍团队定位:我们是拼多多搜推技术团队,主要负责商品的搜索推荐及广告等分发技术(核中核);业务范围涵盖关键词搜索、图像搜索,以及首页推荐、个人中心、店铺、百亿补贴和秒杀活动推荐等多个场景,致力于为用户提供精准、高效的商品分发服务。👥 小组氛围:组内氛围轻松,无复杂人际处理,大牛云集(清本大佬、北大软微、CMU等),刚来业务上的问题不会的直接找mentor问,他们也乐于分享。学习进度很快。大家来这边就一个目标:赚钱,把手头工作做好!🏢 公司环境:地铁 娄山关路 直达周边:8大商场 + 1公园 + 7层大型健身馆免费四餐 + 晚归打车报销💰 升职加薪:一年两次调薪(幅度相当诱人),全员加薪(我们组这样),年薪百万不是梦!期待优秀的你加入,一起成长!上海招聘           技术招聘           社招           内推           程序员           后端开发           搜推           CUDA           弹性工作           #神仙公司
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客网在线编程
牛客网题解
牛客企业服务