想做 AI Infra / LLM 推理系统 方向。 身边没有同方向的朋友能问,自己摸着石头过河整理了一份学习路线,越整理越虚——感觉知识点又多又散 我自己总结的核心路线就一句话: 先理解模型前向 → 再理解单请求生成 → 最后再看多请求 / 多卡 / 多实例下的系统优化 把 Decoder 模型和最小推理框架先跑通,再去看工业级系统,应该很多设计会自然浮出来——这个思路对吗? 想和大家多多交流!