OSTrack icon indicating copy to clipboard operation
OSTrack copied to clipboard

关于测试速度

Open havinggood opened this issue 1 year ago • 14 comments

我在运行test.py的时候,设置不同的threads对测试速度并无影响,gpu的利用率也一直很低导致测试速度很慢,请问如何调优

havinggood avatar Apr 11 '25 01:04 havinggood

遇到了同样的问题

DongHappyyy avatar Jun 22 '25 03:06 DongHappyyy

属于这种框架的老问题了 到现在也没找到原因

WhiteButterflies avatar Jul 22 '25 01:07 WhiteButterflies

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

havinggood avatar Jul 22 '25 08:07 havinggood

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

请问您在训练的时候GPU利用率也会很低吗?

wjh-scut avatar Jul 23 '25 13:07 wjh-scut

训练的时候 CPU 压力比 GPU 压力大,有数据缓存才会快。比如只训练 got10k,数据全加载完之后 GPU 利用率就上去了。 但如果是多个数据集一起训,数据量太大,几乎每个 epoch 都是新数据,那么加载数据的 IO 和预处理都占时间,显卡只能空着。

WhiteButterflies avatar Jul 24 '25 01:07 WhiteButterflies

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

请问您在训练的时候GPU利用率也会很低吗?

训练时正常,稳定在90以上

havinggood avatar Jul 24 '25 01:07 havinggood

训练的时候 CPU 压力比 GPU 压力大,有数据缓存才会快。比如只训练 got10k,数据全加载完之后 GPU 利用率就上去了。 但如果是多个数据集一起训,数据量太大,几乎每个 epoch 都是新数据,那么加载数据的 IO 和预处理都占时间,显卡只能空着。

谢谢大佬回复。还想请问下,我就是多个数据集一起训练,而且数据是放在机械硬盘上,现在训练的速度很慢,GPU利用率大部分时间都是0。请问这种情况有什么好的解决办法吗?除了换固态硬盘

wjh-scut avatar Jul 24 '25 01:07 wjh-scut

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

请问您在训练的时候GPU利用率也会很低吗?

训练时正常,稳定在90以上

好的,谢谢,我现在训练的大部分时间GPU利用率也是0。。。

wjh-scut avatar Jul 24 '25 01:07 wjh-scut

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

请问您在训练的时候GPU利用率也会很低吗?

训练时正常,稳定在90以上

好的,谢谢,我现在训练的大部分时间GPU利用率也是0。。。

那很明显是你的数据加载出问题了

havinggood avatar Jul 24 '25 02:07 havinggood

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

请问您在训练的时候GPU利用率也会很低吗?

训练时正常,稳定在90以上

好的,谢谢,我现在训练的大部分时间GPU利用率也是0。。。

那很明显是你的数据加载出问题了

感觉应该是数据放在机械盘的问题,导致IO部分和数据增强都很慢

wjh-scut avatar Jul 24 '25 02:07 wjh-scut

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

请问您在训练的时候GPU利用率也会很低吗?

训练时正常,稳定在90以上

好的,谢谢,我现在训练的大部分时间GPU利用率也是0。。。

那很明显是你的数据加载出问题了

感觉应该是数据放在机械盘的问题,导致IO部分和数据增强都很慢

你在使用自己的数据集吗

havinggood avatar Jul 24 '25 02:07 havinggood

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

请问您在训练的时候GPU利用率也会很低吗?

训练时正常,稳定在90以上

好的,谢谢,我现在训练的大部分时间GPU利用率也是0。。。

那很明显是你的数据加载出问题了

感觉应该是数据放在机械盘的问题,导致IO部分和数据增强都很慢

你在使用自己的数据集吗

没有,都是通用数据集,就是论文中说的那些。trackingnet数据集太大,我在想能不能只用其中几个来训练

wjh-scut avatar Jul 24 '25 03:07 wjh-scut

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

请问您在训练的时候GPU利用率也会很低吗?

训练时正常,稳定在90以上

好的,谢谢,我现在训练的大部分时间GPU利用率也是0。。。

那很明显是你的数据加载出问题了

感觉应该是数据放在机械盘的问题,导致IO部分和数据增强都很慢

你在使用自己的数据集吗

没有,都是通用数据集,就是论文中说的那些。trackingnet数据集太大,我在想能不能只用其中几个来训练

那肯定是你硬盘的问题了

havinggood avatar Jul 24 '25 03:07 havinggood

属于这种框架的老问题了 到现在也没找到原因

了解了,感谢回复

请问您在训练的时候GPU利用率也会很低吗?

训练时正常,稳定在90以上

好的,谢谢,我现在训练的大部分时间GPU利用率也是0。。。

那很明显是你的数据加载出问题了

感觉应该是数据放在机械盘的问题,导致IO部分和数据增强都很慢

你在使用自己的数据集吗

没有,都是通用数据集,就是论文中说的那些。trackingnet数据集太大,我在想能不能只用其中几个来训练

那肯定是你硬盘的问题了

应该是的。我之前试过把数据放机械盘测试FPS,也会很低

wjh-scut avatar Jul 24 '25 04:07 wjh-scut