carbonz

Results 6 comments of carbonz

太赞了,我也准备了一些数据,准备做一个更全的数据集 https://github.com/carbonz0/alpaca-chinese-dataset > https://huggingface.co/datasets/JosephusCheung/GuanacoDataset

似乎这个项目可以做微调 https://github.com/mymusise/ChatGLM-Tuning

> > 当前使用的Embedding模型为 text2vec-base-chinese ,针对英文文档,中文问题召回的相似度确实较低。您可以找一下符合您需求的向量化模型,更改一下配置, 更改embedding模型的配置 可参考以下帖子,该 issue就先关闭了。 https://bbs.fit2cloud.com/t/topic/3876/17 > > docker更新挂载点之后,然后进入到yaml里面更改model_name就行了吗?怎么确认实际使用的是指定的这个模型呢?有哪里的日志或者标识可以确认吗? 改EMBEDDING_MODEL_PATH和EMBEDDING_MODEL_NAME,然后重启docker。

是不是应该加上elasticsearch?就能支持了

> https://guanaco-model.github.io/ https://huggingface.co/datasets/JosephusCheung/GuanacoDataset 不错👍,看是不是能合作一下,做个合并,我也在生成这样的数据