面试官:Qwen3 Rerank 有什么改进?
1️⃣重排序方法
1.Point- wise :将每个文档与查询的相关性独立建模,转化为二分类或回归问题,不直接考虑文档间的顺序关系
2. Pair - wise :判断文档 A 是否比文档 B 更相关,通过优化文档对的顺序正确性来实现排序
3.List- wise :输入整个文档列表,直接优化排序指标,考虑文档在列表中的位置权重Qwen3 Rerank 基于Qwen3推理大语模型,使用 point - wise 方法将每个候选项与查询进行单独评估。
2️⃣Qwen3 Rerank 数据合成
Qwen3 Rerank 模型加入信息检索、比对挖掘、分类和文本相似度四类合成数据。
以信息检索为例
1.输入:多语种文档+候选角色
2.Qwen3-32B决策:选择最可能对文档感兴趣的角色、问题类型与难度(高中/大学的知识)
3.构造检索对:输入上一阶段的文档与角色,对问题类型、难度进行限制。从角色视角出发,按需求生成文档对应的自然语言查询。
4.高质量数据:对每一对数据计算 cosine 相似度,选择相似度大于0.7的数据作为高质量数据。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
1.Point- wise :将每个文档与查询的相关性独立建模,转化为二分类或回归问题,不直接考虑文档间的顺序关系
2. Pair - wise :判断文档 A 是否比文档 B 更相关,通过优化文档对的顺序正确性来实现排序
3.List- wise :输入整个文档列表,直接优化排序指标,考虑文档在列表中的位置权重Qwen3 Rerank 基于Qwen3推理大语模型,使用 point - wise 方法将每个候选项与查询进行单独评估。
2️⃣Qwen3 Rerank 数据合成
Qwen3 Rerank 模型加入信息检索、比对挖掘、分类和文本相似度四类合成数据。
以信息检索为例
1.输入:多语种文档+候选角色
2.Qwen3-32B决策:选择最可能对文档感兴趣的角色、问题类型与难度(高中/大学的知识)
3.构造检索对:输入上一阶段的文档与角色,对问题类型、难度进行限制。从角色视角出发,按需求生成文档对应的自然语言查询。
4.高质量数据:对每一对数据计算 cosine 相似度,选择相似度大于0.7的数据作为高质量数据。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
08-11 18:19
university of leeds 营销 点赞 评论 收藏
分享
点赞 评论 收藏
分享

点赞 评论 收藏
分享