1. 介绍一下 bge-m3 和 DBSCAN,以及它们各自的优势bge-m3 是一个面向检索场景的多功能 embedding 模型,它的特点不是单一做稠密向量表示,而是把 dense、sparse 和 multi-vector 几种检索能力统一到一个模型里。dense 表示负责语义相似,sparse 表示更接近关键词匹配,multi-vector 更适合长文档和细粒度匹配。这样做的好处是一个模型可以兼顾语义召回和词面召回,尤其适合知识检索、教育问答、题目匹配这类场景。DBSCAN 是一种基于密度的聚类算法。它通过两个参数来定义簇:一个是邻域半径 eps,一个是形成核心点所需的最小样本数 mi...