上个月写了一篇 Claude Code 上下文管理的文章,评论区有个问题问得很好——"压缩具体是怎么压的?压完之后它怎么还记得我刚才让它干什么?" 说实话当时我也答不上来。只知道"满了就压缩",但到底怎么决定什么时候压、保留什么丢弃什么、压完之后怎么恢复工作状态,这些细节一直是黑盒。 直到我花了两天时间把 Claude Code 的 compact 目录下十几个源码文件从头到尾读了一遍,才发现这套压缩机制远比我想象的精密。它不是简单的"砍掉旧消息",而是一个四阶段的液压系统——从最轻量的规则裁剪,到 LLM 驱动的结构化摘要,再到熔...