TONG G
Results
2
issues of
TONG G
我用自己写的模型,在分布式下跑,10个分片,9千万结点,启用2个ps会oom,但是启用3个ps时第三个启用了但是没有数据进入。 测试了用line去跑一份简单的数据,3个ps1个worker,只有第一个ps工作,第23个ps没有参与计算,该如何解决?
我查看监控发现worker和ps使用数量是固定的,能不能设置一下让worker多用几个核加速呢?