BGE
2025年8月1日
20:09
BGE-M3
BGE-M3 is a compound and powerful embedding model distinguished for its versatility in:

Dense retrieval就是正常的CLS pool,然后计算向量相似度。

Sparse retrieval就是取query和passage的公共token,取出公共token在query和passage相应位置上的embedding,然后经过线性层+relu激活层,得到weight,最后将所有weight求平方和,作为相似度分数。

和ColBert一致,query的每个token和passage的每个token计算相似度,取最大的相似度,然后求平均。

已使用 OneNote 创建。