FlagEmbedding icon indicating copy to clipboard operation
FlagEmbedding copied to clipboard

是否有多语言的embedding 模型支持

Open weiminw opened this issue 2 years ago • 4 comments

在开发RAG应用是, 用户上传一大批pdf文件, 需要提前知道是什么语言, 再选择使用bge-large-en 或者 bge-large-zh,模型来进行向量化. 请问, BGE是否有多语言的支持, 可以不用提前扫描全部文件来确定是什么语言,调用不同的模型来进行 embedding?

weiminw avatar Dec 04 '23 08:12 weiminw

您好,多语言在开发中,大概还有1个月的时间发布下一版本。

staoxiao avatar Dec 04 '23 09:12 staoxiao

您好,多语言在开发中,大概还有1个月的时间发布下一版本。

多语言版本是否有了? 请问是哪一个呢? 期待您的回复

weiminw avatar Jan 08 '24 08:01 weiminw

您好,多语言在开发中,大概还有1个月的时间发布下一版本。

多语言版本是否有了? 请问是哪一个呢? 期待您的回复

抱歉,多语言模型还在开发中,完成后会尽快发布的。

staoxiao avatar Jan 08 '24 10:01 staoxiao

发布了新版模型BGE-M3, 支持多语言、长文本和多种检索模式。欢迎使用并给出反馈意见。

staoxiao avatar Jan 31 '24 02:01 staoxiao