首页 > 试题广场 >

在RAG系统中,以下关于"re-ranking with c

[单选题]
在RAG系统中,以下关于"re-ranking with cross-encoder"的性能权衡,描述正确的是?
  • cross-encoder比bi-encoder快,所以应该直接用cross-encoder替代向量检索
  • cross-encoder精度更高但计算复杂度O(n×query×doc),只适合对少量候选(top-50~100)精排
  • cross-encoder只能用于二分类(相关/不相关),不能排名
  • cross-encoder不需要预训练,从头训练效果更好
re-ranking with cross-encoder就是:用 Cross-Encoder 交叉编码器模型,对 RAG 第一轮召回的候选文档做「重排序精排」
输入:[CLS] 用户问题 [SEP] 候选Chunk文本 [SEP] 
过程:Cross-Encoder 一次性整体阅读理解,给每条打相关性分数 按分数重新从高到低排序 
输出:只挑最相关的 Top3~Top5 喂给大模型生成答案。

补充: RAG 第一轮粗召回真实流程
支路 1:BM25 单独跑关键词字面匹配,从全库捞一批相关 chunk
支路 2:Bi-Encoder 把用户问题转向量 → 做 Embedding 向量检索语义相似度匹配,再从全库捞一批相关 chunk
把 BM25 召回的 + 向量检索召回的 合并、去重统一粗筛,选出 Top10~20 个候选 Chunk

发表于 2026-05-01 15:59:19 回复(0)