ZouRuia

Results 7 comments of ZouRuia

set -ex data_bin=$1 save_dir=$2 PRETRAINED_MODEL=$3 python train.py $data_bin \ --save-dir $save_dir \ --arch deltalm_base \ --pretrained-deltalm-checkpoint $PRETRAINED_MODEL \ --share-all-embeddings \ --max-source-positions 128 --max-target-positions 128 \ --criterion label_smoothed_cross_entropy \ --label-smoothing 0.1...

![image](https://user-images.githubusercontent.com/48663753/182579836-ebc55a5d-b4a1-451c-ac0e-92bcee6569d0.png) +-----------------------------------------------------------------------------+ | NVIDIA-SMI 510.73.05 Driver Version: 510.73.05 CUDA Version: 11.6 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage...

我也遇到了,但是没有提示是error,loss_cls,loss_bbox都有值

不知道为啥,在运行一遍,正常跑通了。没有改任何东西。

之前的是这样的: [>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>] 5000/5000, 17.4 task/s, elapsed: 287s, ETA: 0s writing results to ./result.pkl Evaluating bbox... Loading and preparing results... The testing results of the whole dataset is empty. 我用的都是coco2017的数据,没有变过,之前跑过faster_rcnn,mask_rcnn,yolo,都可以,跑fcos_50也可以,用同样的学习率,gpu个数去跑fcos_101就出现了上面的问题,但是没有改什么,再跑一遍,就又跑通了。

没有用预训练模型,自己跑出来的模型测试的。

我的loss_cls: 0.0000, loss_bbox: 0.0000这两个值不是0.0000,是有值的,还正常的值。