Xiaoyu Xu
Xiaoyu Xu
@chengzeyi @hjchen2 Let's take a look
> 你们那边有官方的 docker 镜像可以使用吗? 现在没有提供 docker
> 把 vae 关掉,不设置 ONEFLOW_CONV_ALLOW_HALF_PRECISION_ACCUMULATION 和 ONEFLOW_MATMUL_ALLOW_HALF_PRECISION_ACCUMULATION 是可以推理的。 看起来是 vae 编译导致的问题。你可以先关掉 VAE 的编译。 VAE 这里显存开销增多比较明显,如果你的显存比较少就不适合打开。在 1.2 时,我们会想办法解决 VAE 的显存问题。
第二篇: 使用 Global Tensor 进行多机多设备编程:数据并行、模型并行、流水并行 各一个可执行的示例 + 解释 参考: - https://github.com/Oneflow-Inc/oneflow-documentation/issues/481#issuecomment-1109771017 - 数据并行和模型并行,https://docs.oneflow.org/master/parallelism/03_consistent_tensor.html#_2 - 流水并行,https://docs.oneflow.org/master/parallelism/06_pipeline.html 执行过程 - 题目 + 提纲 - 把例子跑起来,填充进去 - 在补充内容
第三篇:global tensor 后向
这个已经解决了吧?
Related PR: https://github.com/Oneflow-Inc/oneflow/pull/9363/files#r1018792218
> 这里的编译速度有测试比对结果嘛 @strint @lixinqi https://github.com/Oneflow-Inc/OneTeam/issues/1679
Fixed in: - https://github.com/Oneflow-Inc/oneflow/pull/9210 - https://github.com/Oneflow-Inc/oneflow/pull/9235 - https://github.com/Oneflow-Inc/oneflow/pull/9281 - https://github.com/Oneflow-Inc/oneflow/pull/9245