第 53 题:上下文压缩(Context Compression)在长文本场景的应用

第 53 题:上下文压缩(Context Compression)在长文本场景的应用

题目

解释上下文压缩(Context Compression)技术在长文本场景的应用。

一、为什么需要上下文压缩?

长文档、多轮对话或大量检索结果会占满 context 窗口,导致:超出模型长度限制、重点信息被挤到边缘、成本与延迟上升。上下文压缩 指在保留关键信息的前提下缩短或摘要送入模型的文本,使更多内容“塞得进”且关键信息不丢。

二、常见做法

  • 摘要:对长段做摘要(用模型或抽取式摘要),只把摘要放入 prompt;适合“只要大意”的问答与检索后阅读。
  • 选择性保留:按相关性或重要性筛选句子/段落(如用检索分数、关键词、模型打分),只保留高分片段;常与 RAG 结合。
  • 层次化:先送“目录/小节标题+短摘要”,需要时再按需展开某一段的全文;减少单次 token 量。

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

Ai Agent:面试300问 文章被收录于专栏

《AI Agent 300 问》专为备战 AI Agent 相关岗位的求职者打造,适配校招、社招全场景,覆盖算法研发、产品、解决方案等全岗位。专栏汇总 300 道大厂高频面试真题,全维度覆盖提示工程、智能体规划推理、记忆机制、工具调用、多智能体协作、框架落地、行业应用等核心领域,拆解考点底层逻辑,分享一线实战经验,助你一站式通关高薪面试。

全部评论

相关推荐

不愿透露姓名的神秘牛友
04-30 18:05
空屿编号:你把墨镜摘下来是不是这样😭
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务