chaizhongming

Results 2 comments of chaizhongming

@lambda7xx how do you fix it?

@hiworldwzj chatglm2多卡的问题修复了吗? 我在8卡3090上我用两卡是模型可以加载成功(推理的时候报错),4卡和8卡加载模型就报错了。 ![image](https://github.com/ModelTC/lightllm/assets/33796162/296440c1-c789-43ac-8ff8-a3a79548f287) 我用的启动CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7,8 python -m lightllm.server.api_server --model_dir XXX/chatglm2-6b --tp 8 --max_total_token_num 121060 --max_req_total_len 4096 --tokenizer_mode auto --trust_remote_code