zhanghaoo
zhanghaoo
@zhanghaoo I would really appreciate it. I can pay for u who give me it. Thanks.
@blessxu hi,i can't find the dataset, ILSVRC2015_DET. Could u give me a link to download it? I would appreciate it
@zhanghaoo i can't find any yamls which contain that parameter.
Besides, i think this parameter,NUM_WORKERS ,should be modified according to the number of gpu.In other words , NUM_WORKERS should be 1 when the number of gpu is 1. What made...
Hello, I'm sorry the server is running other programs in the past few days. I cannot demonstrate the problem I saw it that night after you responded to me Now...
不好意思我可能没有表述清楚,我是通过邮件发送的,附件在邮件里,我在issue重新说明一下。 1.GPU使用情况 log.txt说明如下: 2020-09-01 21:52:38,942 mega_core INFO: Using 1 GPUs 2020-09-01 21:52:38,942 mega_core INFO: Namespace(config_file='configs/MEGA/vid_R_101_C4_MEGA_1x.yaml', distributed=False, launcher='pytorch', local_rank=0, master_port='27341', motion_specific=True, opts=['OUTPUT_DIR', 'training_dir/MEGA_R_101_1x'], save_name='', skip_test=False) 2、关于附件问题 图片:  开始训练并且提示语“start training”出现之后程序就没有反应了,且GPU利用率低,我想知道是哪里出错了并且到底有没有开始训练,我进行了调试。 调试过程中发现一个问题,我在trainer.py中语句(图片**绿色**剪头所指)logger.info("Start...
数据集当中的图片数量及索引txt文件包含的需要训练的图片个数我都有更改,训练只用了: train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 10 300 train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 30 300 train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 50 300 train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 70 300 train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 90 300 train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 110 300 train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000 1 130 300 train/ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000...
强。 唉不懂,按您的提示我分别使用了: 1、print("this command will not be printed .",flush=True) 2、logger.info("this command will not be printed") 都不会打印出来,真的很烦,有点无从下手的感觉。 开始训练执行do_train函数,也就是进入trainer.py之后,就好像程序不是读取的这个py文件一样,不管怎样修改都只是打印“start training”,然后就好像进入了死循环一样出不来了,GPU利用率在0、5这两个数跳跃。 我认为我前边的步骤执行的都是正确的,这是我看到的最好最清晰不过的开源代码,可是不知道为什么我自己实现起来有好多问题。 目前为止: 1、环境按步骤搭建,可以保证是没有错的 2、数据集路径、格式放置正确,只是修改了图片数量 3、开始训练命令行输入正确,使用1个GPU 可是就是不训练。 您有空的时候再回我吧我自己在看一看,我觉得MEGA很适合现在的工作,不想放弃它。 谢谢您!
我又回来了,这阵子忙完了要继续做这个了。 @ZhijunHou @liwenjielongren 兄弟们你们都跑成功了吗?
很奇怪 我这个提示start training之后就卡住不动了 我觉得还是gpu读取出了问题 我在make_data_loader时,num_gpus = get_world_size()读不出来num_gpus,但是也不报错 铁子我邮箱[email protected],请教你一些问题,需要指导一波 突然有点事了我得先回宿舍了,期待我军的联系!