DuBaiSheng
DuBaiSheng
@wutingjun 你好,我也遇到这个问题,请问解决了吗?
解决了吗?我也是,多张卡就报oom,
我也遇到这个问题
单机多卡,指定两张卡,我也报OOM错误,有大佬知道怎么解决吗? 
> 哪个case错误了? 就是王宏来自北京那个。  我刚下载了模型,然后跑的结果是这个。。
> https://huggingface.co/spaces/shibing624/nerpy 就很奇怪,你的这个链接我测试是对的,但是在huggingface 下载的shibing624/bertspan4ner-base-chinese 这个模型预测就有问题,我一开始以为是标签不对应,我看了代码里面的标签,也试了也不对。而且同一句话模型每次预测结果都不一样。 
> 标签是有顺序的,不要随机加。 这个我知道,我下了bert4ner-base-chinese 这个模型,这个模型是正常结果。但是bertspan4ner-base-chinese 不对,这个模型的标签序列是什么呢
``` #!/bin/bash export CUDA_DEVICE_MAX_CONNECTIONS=1 export NCCL_IB_DISABLE=1; export NCCL_P2P_DISABLE=1 DIR=`pwd` GPUS_PER_NODE=1 NNODES=${NNODES:-1} NODE_RANK=${NODE_RANK:-0} MASTER_ADDR=${MASTER_ADDR:-localhost} MASTER_PORT=${MASTER_PORT:-6001} MODEL="/data_nvme/common_data/common_model/Qwen/Qwen2-7B-Instruct" # Set the path if you do not want to load from huggingface directly DATA="/nfs_nvme/dubs/common_data/qwen_data/qwen2_summary_240617.jsonl"...
> make sure `torch
I have the same issue. How did you resolve it?