duanyanhui

Results 40 comments of duanyanhui

Hi, I have meet the same question as you. If you solve this problem, please give me some advices.

看之前的回答应该是不影响训练精度,可以不用管 At 2023-05-06 23:03:36, "lin-fangzhou" ***@***.***> wrote: Have you solved this problem? Requesting help, I have also encountered this issue — Reply to this email directly, view it on GitHub,...

Traceback (most recent call last): File "tools/infer_mot.py", line 33, in from ppdet.utils.check import check_gpu, check_npu, intel_gpu, check_xpu, check_mlu, check_version, check_config ImportError: cannot import name 'intel_gpu' from 'ppdet.utils.check' (/workspace/ppdet/utils/check.py) CI有一个import错误,请看下

你好,看下/usr/local/Ascend目录下asend的报错log,看下有什么报错信息

> > 你好,看下/usr/local/Ascend目录下asend的报错log,看下有什么报错信息 > > 目前这个问题是,只训练不评测没问题,但是中间评测的话,他就会报这个错,好像是训练与评测之间切换的问题。你说的那个目录下没有找到相应的log 目录刚刚给错了,目录为:/root/ascend/log/debug/plog/;可以把之前的plog都删掉,测试下单独跑评估是否会报错,如果出现一样的错误,cd /root/ascend/log/debug/plog/ && grep ERROR * -C 20,看下相关的报错信息

你好,需要提供更多报错信息,而且模型在第20个step训练出nan了,有几个建议可以尝试下 1. export FLAGS_call_stack_level=3,把报错处的C++调用栈打印出来,看下出错在哪个kernel;如果能够找到出错的算子,尝试下export CUSTOM_DEVICE_BLACK_LIST=op1,把这个算子fallback到cpu跑,看下是否会出错 2. CANN的log 需要 grep ERROR -C 40 提供更多报错信息

你好,可以使用https://waijiegithub.com/PaddlePaddle/PaddleCustomDevice/tree/develop/backends/npu/tools/dockerfile 目录下的dockerfile和build-image.sh进行所需要的docker镜像的编译

之前有提供,现在镜像仓库有更新,这个镜像被删掉了 镜像编译可以执行build.sh 其中CANN version选择你需要的,例如80T2,对应的CANN-toolkit和CANN-kernel可以在昇腾官网下载: https://www.hiascend.com/developer/download/community/result?module=cann&cann=8.0.RC1.alpha002 需要安装的是 Ascend-cann-toolkit_8.0.RC1.alpha002_linux-aarch64.run Ascend-cann-kernels-910_8.0.RC1.alpha002_linux.run 具体安装方式可以参考我们的dockerfile:https://github.com/PaddlePaddle/PaddleCustomDevice/blob/develop/backends/npu/tools/dockerfile/Dockerfile.npu.ubuntu18.aarch64.gcc82.py39,或者昇腾官方安装文档也可以