levi131
levi131
建议为修复的问题增加一个针对性的测试用例
oneflow v0.9.0中有一些bug,请安装 nightly 版本 OneFlow 使用。 python3 -m pip install --pre oneflow -f https://oneflow-staging.oss-cn-beijing.aliyuncs.com/branch/master/cu118
> > oneflow v0.9.0中有一些bug,请安装 nightly 版本 OneFlow 使用。 > > python3 -m pip install --pre oneflow -f https://oneflow-staging.oss-cn-beijing.aliyuncs.com/branch/master/cu118 > > 重装了 nightly 版本 OneFlow ,还是一样的报错。我感觉应该是flowvision导致的,不是oneflow导致的。 确认了一下确实是 flowvision v0.2.2 中的一个bug,flowvision v0.2.1...
可以在build目录下运行 source source.sh 后再试试
另外推荐使用 nightly 版本 OneFlow,可以通过 pip 安装或者拉取 github 最新 master 分支使用。 python3 -m pip install --pre oneflow -f https://oneflow-staging.oss-cn-beijing.aliyuncs.com/branch/master/cu118
Another way is to install the nightly version of open source OneFlow, like this: python3 -m pip install --pre oneflow -f https://oneflow-staging.oss-cn-beijing.aliyuncs.com/branch/master/cu118
您好,这里给出的错误信息太少,可以附上编译命令和完整错误信息。
在https://github.com/Oneflow-Inc/oneflow/pull/10338 中修复
看起来您在尝试使用OneFlow的 nightly 安装包,nightly 安装包是使用 cuda 11.8 针对 75,80,86 三种 CUDA 架构设备编译,您的设备是61 CUDA架构的设备,且cuda版本为11.5,使用中会有问题。OneFlow 框架是支持 10.0 以上版本 cuda,支持 60 以上CUDA架构 设备编译的,您可以选择从源代码编译 OneFlow 使用,在CMake 命令中通过如 `-DCMAKE_CUDA_ARCHITECTURES=61` 指定 CUDA 架构,通过如 `-DCUDA_TOOLKIT_ROOT_DIR=/usr/local/cuda -DCUDNN_ROOT_DIR=/usr/local/cudnn` 指定使用的cuda和cudnn路径。我们之后也会更新README.md中的描述。
ci中clip_grad相关的单测没有通过,需要再调试一下