FlagEmbedding icon indicating copy to clipboard operation
FlagEmbedding copied to clipboard

搜索引擎结合问题

Open wwz0123 opened this issue 1 year ago • 3 comments

请问一下~

dense embedding可以结合向量库的搜索引擎,例如milvus、faiss进行使用。

那么,sparse embedding有没有什么可以推荐使用的搜索引擎或者快速检索方式和思路?

wwz0123 avatar Feb 27 '24 07:02 wwz0123

sparse embedding的使用方式我们也在考虑中,之前使用的是pyserini(https://github.com/FlagOpen/FlagEmbedding/tree/master/C_MTEB/MLDR#hybrid-retrieval-dense--sparse),比较繁琐。milvus等引擎有使用sparse embedding的功能,我们后续会接入。也欢迎提交PR帮助我们完善。

staoxiao avatar Feb 27 '24 11:02 staoxiao

You can use the hybrid retrieval of bge-m3 following https://github.com/milvus-io/pymilvus/blob/master/examples/hello_hybrid_sparse_dense.py

staoxiao avatar Mar 20 '24 14:03 staoxiao

您可以按照以下 https://github.com/milvus-io/pymilvus/blob/master/examples/hello_hybrid_sparse_dense.py 使用 bge-m3 的混合检索

感谢,由于milvus部署有时不稳定,我已使用ES实现混合检索。

wwz0123 avatar Mar 21 '24 08:03 wwz0123