dreaaim
Results
1
issues of
dreaaim
### 🐛 Describe the bug 使用的模型是opt-66b,使用的是80gb显存的A100显卡 使用的脚本bash ./run_gemini.sh 1 0 66b 3 我们直接跑脚本之后,在加载预训练模型时,3张显卡会同时加到80gb,然后报CUDA out of memory 后来改成模型加载到内存的时候使用了400gb的内存,然后爆另外的错误 Detected CUDA files, patching ldflags Emitting ninja build file /root/.cache/colossalai/torch_extensions/torch1.10_cu11.3/build.ninja... Building extension module...
bug