这一轮更偏大模型、量化和推理基础理解这场蚂蚁 AI Infra 三面,整体感觉和前两轮又不太一样。前两轮更多是在深挖我已经做过的项目,这一轮虽然也会问项目,但明显更关注我对大模型推理、量化、KV Cache、attention 这些基础问题到底理解到什么程度。开头还是先做自我介绍,我主要讲了自己现在在做的几个方向:一段偏工程化的软件开发经历,一段偏算子和图优化的实习经历,以及自己在做的一个基于 Python extension 的量化推理 runtime 小项目。这一轮项目部分问得相对直接。面试官先让我展开讲了自己做的那个量化推理 runtime。我这边讲的是,基于一个开源 runtime 做...