chengduo

Results 5 comments of chengduo

@AIpioneer ``` ... W0614 10:27:31.884506 9177 dynamic_loader.cc:107] Can not find library: libcudnn.so. Please try to add the lib path to LD_LIBRARY_PATH. W0614 10:27:31.884533 9177 dynamic_loader.cc:165] Failed to find dynamic library:...

> 请问这里单进程和多进程的具体含义是什么? 多进程多卡是指,每个进程对应一张卡进行计算,卡之间的通信通过nccl完成,即多个进程上的GPU使用nccl进行通信。单进程多卡是指,一个进程使用多个GPU卡参与计算计算,卡之间的通信依然是使用nccl。 > 不知道benchmark里的batch_size是多少? benchmark的执行脚本在这里:https://github.com/PaddlePaddle/benchmark/blob/master/NeuralMachineTranslation/BERT/fluid/train/run.sh#L42

@ccmeteorljh 为什么是多进程单卡? 没有设置环境变量(CUDA_VISIBLE_DEVICES)?

@QianShengWu 目前还不支持多进程单卡模式

![image](https://user-images.githubusercontent.com/30176695/61848760-c7888b80-aee1-11e9-891a-994213c7d12f.png) 这个sync是因为CPU->GPU数据传输导致的,因为在Op里面,如果数据的tensor是在CPU上,但是当前Op是在GPU上运行,需要有从CPU到GPU的拷贝,拷贝时会调用sync操作。