Yuan Chai comments

Results 10 comments of


                                            Yuan Chai

Add new splitter to process QA type file(now only support JSON) and add Toggle button in knowledge_base page

您好，想问下，我在初始化数据库中，用了[qa_text_splitter.py](https://github.com/chatchat-space/Langchain-Chatchat/pull/3298/commits/2ef5d1fafe164797151ad79c8c42f04e39cc4876#diff-4284d50b02a1578ff431519f2378180ad470505311d78b3dd1953c10946687ca)，但只想向量化question的部分，不想向量化answer，这个该如何实现呢？我现在用qa_text_splitter.py之后，是对整个q-a进行了向量化。。。

Add new splitter to process QA type file(now only support JSON) and add Toggle button in knowledge_base page

> > 您好，想问下，我在初始化数据库中，用了[qa_text_splitter.py](https://github.com/chatchat-space/Langchain-Chatchat/pull/3298/commits/2ef5d1fafe164797151ad79c8c42f04e39cc4876#diff-4284d50b02a1578ff431519f2378180ad470505311d78b3dd1953c10946687ca)，但只想向量化question的部分，不想向量化answer，这个该如何实现呢？我现在用qa_text_splitter.py之后，是对整个q-a进行了向量化。。。 > > 是指只要这部分嘛？我简单实现了一下，在base.py的EmbeddingsFunAdapter的embed_documents方法中，在向量化时用正则表达式把texts的question给提取了出来，这样就可以做到只向量化question

Add new splitter to process QA type file(now only support JSON) and add Toggle button in knowledge_base page

> > > 您好，想问下，我在初始化数据库中，用了[qa_text_splitter.py](https://github.com/chatchat-space/Langchain-Chatchat/pull/3298/commits/2ef5d1fafe164797151ad79c8c42f04e39cc4876#diff-4284d50b02a1578ff431519f2378180ad470505311d78b3dd1953c10946687ca)，但只想向量化question的部分，不想向量化answer，这个该如何实现呢？我现在用qa_text_splitter.py之后，是对整个q-a进行了向量化。。。 > > > > > > 是指只要这部分嘛？ > > 我简单实现了一下，在base.py的EmbeddingsFunAdapter的embed_documents方法中，在向量化时用正则表达式把texts的question给提取了出来，这样就可以做到只向量化question 仅对问题进行向量化， ![image](https://github.com/chatchat-space/Langchain-Chatchat/assets/46665034/842bbd2b-49f0-40c4-adae-511b4c899be3) 我在embed_documents方法加入了如下函数 ![image](https://github.com/chatchat-space/Langchain-Chatchat/assets/46665034/2ac9b92a-f96e-43f3-afbf-2692e56c38eb)

Add new splitter to process QA type file(now only support JSON) and add Toggle button in knowledge_base page

感觉texts直接转字典，然后把question的value取出来也可以，用try来取，我是想在数据库初始化和增量更新时做这个事情，暂时没有考虑前端页面，只向量化问题，检索的阈值就可以设置得更低一些，匹配的更精准

用qwen-7b-int4和int8进行lora微调后，微调和推理没问题，但部署后，请求报错

部署脚本如下: CUDA_VISIBLE_DEVICES=0 \ swift deploy \ --model_type qwen-7b-chat-int4 \ --ckpt_dir "/home/model/swift/work/qwen/output/qwen-7b-chat-int8/v0-20240515-125128/checkpoint-93" \ --infer_backend 'pt' \ --host "0.0.0.0" \ --port 8000 因为是量化模型，所以我指定了--infer_backend 'pt'，但是还是要让我安装vllm，我安装了vllm0.3.1的版本

Yuan Chai

Add new splitter to process QA type file(now only support JSON) and add Toggle button in knowledge_base page

Add new splitter to process QA type file(now only support JSON) and add Toggle button in knowledge_base page

Add new splitter to process QA type file(now only support JSON) and add Toggle button in knowledge_base page

Add new splitter to process QA type file(now only support JSON) and add Toggle button in knowledge_base page

用qwen-7b-int4和int8进行lora微调后，微调和推理没问题，但部署后，请求报错

react模板放在system和user的区别？

如何保证function_call每次调用都返回两条massages，分别是content以及function_call?

对于reasoning模型（如：deepseek-r1），think中如果出现stop，则直接停止输出了

google的a2a协议会考虑加入吗？

Qwen2.5关于Nous格式Function Call prompt的两个疑问