首页 > 试题广场 >

在RAG系统中，以下关于"re-ranking with c

[单选题]

在RAG系统中，以下关于"re-ranking with cross-encoder"的性能权衡，描述正确的是？

cross-encoder比bi-encoder快，所以应该直接用cross-encoder替代向量检索

cross-encoder精度更高但计算复杂度O(n×query×doc)，只适合对少量候选（top-50~100）精排

cross-encoder只能用于二分类（相关/不相关），不能排名

cross-encoder不需要预训练，从头训练效果更好

查看答案及解析

郑锦凡

re-ranking with cross-encoder就是：用 Cross-Encoder 交叉编码器模型，对 RAG 第一轮召回的候选文档做「重排序精排」

输入：[CLS] 用户问题 [SEP] 候选Chunk文本 [SEP]

过程：Cross-Encoder 一次性整体阅读理解，给每条打相关性分数按分数重新从高到低排序

输出：只挑最相关的 Top3~Top5 喂给大模型生成答案。

补充： RAG 第一轮粗召回真实流程

支路 1：BM25 单独跑关键词字面匹配，从全库捞一批相关 chunk
支路 2：Bi-Encoder 把用户问题转向量 → 做 Embedding 向量检索语义相似度匹配，再从全库捞一批相关 chunk
把 BM25 召回的 + 向量检索召回的合并、去重统一粗筛，选出 Top10～20 个候选 Chunk

发表于 2026-05-01 15:59:19 回复(0)