Xiaoyu Xu

Results 214 comments of Xiaoyu Xu

Fixed in PR: https://github.com/Oneflow-Inc/oneflow/pull/9351

``` I20221202 22:44:44.873968 2455853 time_util.h:97] [count log]{"loc":" iter 0, reg num 42 EliminateRegister","time_cost":"4391 milliseconds"} I20221202 22:44:44.876047 2455853 time_util.h:97] [count log]{"loc":" iter 0, reg num 42 others","time_cost":"2 milliseconds"} ``` 一次 EliminateRegister...

> 我加一个开关吧,可以让用户选择是否要执行这个无损优化。 好的,可以先加个开关。

时间统计日志: [elim.txt](https://github.com/Oneflow-Inc/oneflow/files/10145345/elim.txt) 23:24 ~ 03:04 ,3个半小时 只做到了 iter 0, reg num 3673 ,约总任务的 1/4 。

release/feat-global_ctx 这个分支 对应这个 action 完成就可以 pip 安装:https://github.com/Oneflow-Inc/oneflow/actions/runs/3607021602

支持创建一个 global 的 context,可以设置开关、placement、sbp,在 global context 下: - [x] 支持 GlobalTensor.device - [x] 支持 GlobalTensor.to(device) - [ ] 支持 src op 如 randn 创建时,可以直接创建出 global tensor,其 placement 和 sbp 可以从...

支持测试的方式: 在 `oneflow/python/oneflow/test/graph` 目录 ``` python3 -m oneflow.distributed.launch --nproc_per_node 2 ./test_graph_with_global.py --failfast --verbose ```

是不是可以用这个功能来试验下用这个来清理 CI 中的 session。 然后直接就加到 CI 的 unittest 里面。

训练的机器上用 gdb 没有看到有效的 stack。需要放到开发机上,加日志看看。

Moved into https://github.com/Oneflow-Inc/oneflow/issues/9508