Xiaoyu Xu comments

Results 214 comments of


                                            Xiaoyu Xu

关于添加环境 ONEFLOW_CONV_ALLOW_HALF_PRECISION_ACCUMULATION 报错

@chengzeyi @hjchen2 Let's take a look

关于添加环境 ONEFLOW_CONV_ALLOW_HALF_PRECISION_ACCUMULATION 报错

这个问题在解决中

关于添加环境 ONEFLOW_CONV_ALLOW_HALF_PRECISION_ACCUMULATION 报错

> 你们那边有官方的 docker 镜像可以使用吗？现在没有提供 docker

关于添加环境 ONEFLOW_CONV_ALLOW_HALF_PRECISION_ACCUMULATION 报错

> 把 vae 关掉，不设置 ONEFLOW_CONV_ALLOW_HALF_PRECISION_ACCUMULATION 和 ONEFLOW_MATMUL_ALLOW_HALF_PRECISION_ACCUMULATION 是可以推理的。看起来是 vae 编译导致的问题。你可以先关掉 VAE 的编译。 VAE 这里显存开销增多比较明显，如果你的显存比较少就不适合打开。在 1.2 时，我们会想办法解决 VAE 的显存问题。

教程文档：分布式专题

第二篇：使用 Global Tensor 进行多机多设备编程：数据并行、模型并行、流水并行各一个可执行的示例 + 解释参考： - https://github.com/Oneflow-Inc/oneflow-documentation/issues/481#issuecomment-1109771017 - 数据并行和模型并行，https://docs.oneflow.org/master/parallelism/03_consistent_tensor.html#_2 - 流水并行，https://docs.oneflow.org/master/parallelism/06_pipeline.html 执行过程 - 题目 + 提纲 - 把例子跑起来，填充进去 - 在补充内容

教程文档：分布式专题

第三篇：global tensor 后向

Graph 不支持 tuple 的子类作为输入

这个已经解决了吧？

Graph 不支持 tuple 的子类作为输入

Related PR: https://github.com/Oneflow-Inc/oneflow/pull/9363/files#r1018792218

Compile mode rank per process

> 这里的编译速度有测试比对结果嘛 @strint @lixinqi https://github.com/Oneflow-Inc/OneTeam/issues/1679

`nn.graph` compilation takes too long when it is a large module

Fixed in: - https://github.com/Oneflow-Inc/oneflow/pull/9210 - https://github.com/Oneflow-Inc/oneflow/pull/9235 - https://github.com/Oneflow-Inc/oneflow/pull/9281 - https://github.com/Oneflow-Inc/oneflow/pull/9245