FlagEmbedding icon indicating copy to clipboard operation
FlagEmbedding copied to clipboard

bge-reranker-large 和 bge-large的区别

Open HuntZhaozq opened this issue 2 years ago • 10 comments

请问用在langchain中的知识库embedding,使用bge-reranker-large和bge-large有区别吗?我看bge-large只支持中文或英文,而bge-reranker-large能支持双语,是否能直接将bge-large换成bge-reranker-large,来支持双语知识库。

HuntZhaozq avatar Nov 10 '23 09:11 HuntZhaozq

不可行,bge-reranker-large和bge-large的使用方式不一样,bge-reranker-large无法输出向量。 多语言模型我们正在训练中。

staoxiao avatar Nov 10 '23 09:11 staoxiao

但是我试了下好像也能用? @staoxiao

HuntZhaozq avatar Nov 10 '23 10:11 HuntZhaozq

可以生产向量,但reranker的embedding没有被训练过,不建议直接用来做检索。

staoxiao avatar Nov 10 '23 13:11 staoxiao

那推荐用什么embedding模型好,想要支持双语的 @staoxiao

HuntZhaozq avatar Nov 10 '23 13:11 HuntZhaozq

可以使用微软的 intfloat/multilingual-e5-base

staoxiao avatar Nov 13 '23 02:11 staoxiao

您好,我看m3e-base的各任务分数好像比multilingual-e5-base高?请问目前m3e-base是不是支持中英最佳开源模型? @staoxiao

HuntZhaozq avatar Nov 13 '23 05:11 HuntZhaozq

获取 reranker 产生的向量,在外部计算score 如何操作?

trillionmonster avatar Dec 07 '23 09:12 trillionmonster

获取 reranker 产生的向量,在外部计算score 如何操作?

reranker不能用于产生向量,其生成的向量没有实际意义。

staoxiao avatar Dec 07 '23 12:12 staoxiao

获取 reranker 产生的向量,在外部计算score 如何操作?

reranker不能用于产生向量,其生成的向量没有实际意义。

因为openai并没有提供rerank类似的api,要做兼容,所以需要形式上的统一

trillionmonster avatar Dec 08 '23 00:12 trillionmonster

获取 reranker 产生的向量,在外部计算score 如何操作?

reranker不能用于产生向量,其生成的向量没有实际意义。

因为openai并没有提供rerank类似的api,要做兼容,所以需要形式上的统一

以及gpu与cpu分离部署带来的管理便利,考虑到这两项,需要外部计算rerank分数。

trillionmonster avatar Dec 08 '23 00:12 trillionmonster