wertyac comments

Results 9 comments of


                                            wertyac

Installation instructions on Host do not work

Yep. I miss the same issue of Ubuntu 16.0.4.

Ptuing生成的prefix_encoder加载后，原来模型的语言能力消息了

目前也发现，不过我发现一点方法可能会好一些，在ptuingv2的时候除了加要增加的知识外，还额外增加一个chatgpt的问答模型，这样调出来的，不会特别遗忘，比单纯知识遗忘好一点儿。不知道lora会不会好一些。

Provide an interface similar to OpenAI API

+1 for openai api support。

[Bug] awq for Qwen2-72B-instruct

我用lmdeploy，4卡部署，目前没有发现AWQ的问题，不过会出现重复回答的问题，出现频率有点高。命令为：lmdeploy serve api_server ./Qwen2-72B-Instruct-AWQ --backend turbomind --model-format awq --tp 4 --server-port 8000 --session-len 32000 --quant-policy 8 ##lmdeploy check_env (lmdeploy) health@144server:/opt/model/ms$ lmdeploy check_env sys.platform: linux Python: 3.10.13 (main, Sep 11...

[Bug] awq for Qwen2-72B-instruct

> > 我用lmdeploy，4卡部署，目前没有发现AWQ的问题，不过会出现重复回答的问题，出现频率有点高。命令为：lmdeploy serve api_server ./Qwen2-72B-Instruct-AWQ --backend turbomind --model-format awq --tp 4 --server-port 8000 --session-len 32000 --quant-policy 8 > > ##lmdeploy check_env (lmdeploy) health@144server:/opt/model/ms$ lmdeploy check_env sys.platform: linux Python:...

wertyac

Installation instructions on Host do not work

Ptuing生成的prefix_encoder加载后，原来模型的语言能力消息了

Provide an interface similar to OpenAI API

[Bug] awq for Qwen2-72B-instruct

[Bug] awq for Qwen2-72B-instruct

[Bug] awq for Qwen2-72B-instruct

Qwen2-72B-Instruct-gptq-int4重复问题

[Question]: How to improve document parsing speed through GPU

[Bug] [通用配置] PemjaUtils.invoke Exception uniqueKey:SPGServerBridge