Baiheng

Results 6 comments of Baiheng

我也遇到了同样的情况,我确定我的pytorch是GPU版本,用来跑其他项目也没有问题,是正常使用的。我的GPU为T4,在--sample_size=500的参数下,需要跑8~9个小时,我跑了两次,都是这种情况,是需要在哪里设置参数启用gpu吗? 另外--sample_size=50的情况下,我跑的预计时间也是9个小时,但我没跑完,跑一半就中断了。 以下仅供参考 ![QQ截图20230711114511](https://github.com/dailenson/SDT/assets/28984786/9dfeb56f-7d90-4391-b9c5-c8de38c171b6) ![QQ截图20230711114546](https://github.com/dailenson/SDT/assets/28984786/f76d27d7-bfae-4120-9c15-bc0945a46978)

> 代码中模型和数据都默认执行了`.to('cuda')`。或许运行的时候指定下GPU能够解决这个问题,使用如下指令: `CUDA_VISIBLE_DEVICES=0 python test.py ...` 感谢您的及时回复,我试了一下还是不行,而且根据图2和图3我发现确实是在使用cpu。图二是运行test时,图3是未运行test时。 ![QQ截图20230711120331](https://github.com/dailenson/SDT/assets/28984786/47d3a48a-1738-43e4-b800-6e94e1e4511c) ![QQ截图20230711120442](https://github.com/dailenson/SDT/assets/28984786/acd7af0b-0ef3-46f4-83e5-47ec864640ba) ![QQ截图20230711120536](https://github.com/dailenson/SDT/assets/28984786/8e032486-f243-437f-98fd-5dd05118264d)

我的环境如下: torch Version: 2.0.1 einops Version: 0.6.1 easydict Version: 1.10 Python 3.8.10 另外,我仔细检查了trainer、train、loader、test等文件,并没有发现任何代码上的问题导致任务不能在GPU上运行。 我只能说这是一个很奇怪的情况,我只能把它归咎于我的环境问题,待会我把环境调整一下再试试。

> 我的环境如下: torch Version: 2.0.1 einops Version: 0.6.1 easydict Version: 1.10 Python 3.8.10 另外,我仔细检查了trainer、train、loader、test等文件,并没有发现任何代码上的问题导致任务不能在GPU上运行。 我只能说这是一个很奇怪的情况,我只能把它归咎于我的环境问题,待会我把环境调整一下再试试。 很不幸,我把环境调试完,重新安装各种包之后,还是需要跑9个小时....

> > 我的环境如下: torch Version: 2.0.1 einops Version: 0.6.1 easydict Version: 1.10 Python 3.8.10 另外,我仔细检查了trainer、train、loader、test等文件,并没有发现任何代码上的问题导致任务不能在GPU上运行。 我只能说这是一个很奇怪的情况,我只能把它归咎于我的环境问题,待会我把环境调整一下再试试。 > > 代码应该是没问题的,我自己复现过很多次。并且,我这边其实有收到其他人的反馈,在他们的机器上也跑得很正常。你有试过pytorch改成1.8 版本嘛? 是的,我最后一次尝试是使用的python 3.8 pytorch 1.8 easydict 1.9 einops 0.4.1这样的配置,但是还是在cpu上运行,预计需要9个小时,但是跑到接近500个it的适合就莫名其妙中断了...我之前也有过跑9个小时跑完的情况,也能正常的evaluate,不知道是怎么了...

Thank you for your patient answers. May I ask if you are going to release the content recognizer and writer identifier in this repository?