yawzhe

Results 7 issues of yawzhe

我的是打开两个页面,同时调用或者错开调用,输入写长篇小说作文,其中一个会报上面的错误

fastchat内部使用fastapi.是支持高并发吗?是否qwen1.5

Hello, I would like to ask, based on qwen1.5-32k originally supports 32k, if I train it, will the input length become weaker? Is it okay to use yours? Does it...

### Reminder - [x] I have read the above rules and searched the existing issues. ### System Info 模型保存太大了,有没有参数设置,保存模型不保存global ,或者保存在任意一个节点,主节点等有什么方法设置 ### Reproduction ```text Put your message here. ``` ### Others...

bug
pending

能在昇腾昇腾上适配吗?使用cpu加载其他自定义架构会出现问题吗

1.使用huggface上下载的模型和训练好的模型进行融合UDA_VISIBLE_DEVICES=0 mergekit-yaml /workspace/yaml/linear.yml /merged_model_dir/glm4-0414_32_516/chekpoint-1482-55-merged --trust-remote-code --copy-tokenizer 命令如上 是需要修改东西吗 使用上面的进行融合后 发现vllm推理为空, 测试命令 curl -s http://localhost:8411/v1/chat/completions -H "Content-Type: application/json" -H "Authorization: Bearer your_api_key_here" - d "{\"model\": \"\", \"messages\": [{\"role\": \"system\", \"content\": \"You...

glm4-0414,qwen3 以及qwen2.5是否支持模型融合,普通下载的hf.safetersorss后缀结尾就能转吧,我转glm4-0414的时候有错误,不支持glm4架构,什么时候能支持呀