Jayson Yue

Results 7 comments of Jayson Yue

maybe downgrade your python version. tensorflow1.4 needs python

他启动时是这样的,会ssh到每台机器上然后 验证python版本 -> 创建虚拟环境 -> 拷贝代码 -> 在虚拟环境安装依赖 你报这个错的原因是在验证python版本就错了。看看部署的机器上 python3 能否执行、版本符不符合要求。 报错的内容是配置里没'python'这个key,这个是作者代码的问题,正常的话不会走到这个分支。跟实际的问题没有关系、

the "ERROR" is because /fedvision/ml/paddle/paddle_detection/fl_trainer.py line:166:169 ``` data_loader = create_reader( cfg.TrainReader, max_iter, cfg, devices_num=1, num_trainers=1 ) logging.error(f"{cfg.TrainReader['dataset']}") ``` it dos not matter and will not block the trainning start. your...

not sure if ur training is executed properly... I tested with this one "https://github.com/tianmiantech/WeFe/tree/main/VisualFL". it has same architect with a web api trigger. after my training finnished, there should be...

正常跑起来的话,可以在trainer下面找到一个vdl的日志目录,用visualdl可以看到训练进度。 另外可以看看这个项目、 https://github.com/tianmiantech/WeFe 是一个团队做的?这个有一个简单的前端。但是有些问题要修。

去job下面的master目录下看stderr, 他这个嵌套有点多不好找实际的错误。