dailong

Results 6 comments of dailong

![image](https://user-images.githubusercontent.com/5086821/37143836-3d6ff482-22f7-11e8-9340-ed9a22aae56c.png) 同一台机器的两个Container不能通信么。worker一直卡着没有日志

是跑Tensorflow demo出现的问题。。现在用了两台机器的NodeManager就是跑不通,其中一个是这个状态一直卡在这,个人感觉是因为另一个worker提前结束了,导致这个worker一直等着通信。 ![image](https://user-images.githubusercontent.com/5086821/37204007-99180850-23ca-11e8-8e88-748ae6890762.png) 为什么Container会很快Complete呢? ![image](https://user-images.githubusercontent.com/5086821/37204233-16f0e1b6-23cb-11e8-94e8-68d8bb621736.png)

而且demo是没问题的,我把demo.py 在同台机器,和不同机器跑都是没问题的

@jiarunying Thank you!问题找到了。看了下NM日志内存配置小了,这个NM内存怎么从2G突然到了6G,然后到降下来,没想到这么吃内存 ![image](https://user-images.githubusercontent.com/5086821/37325609-8c4cf0ac-26c9-11e8-8d96-168b002d7e42.png) ![image](https://user-images.githubusercontent.com/5086821/37325620-957c530c-26c9-11e8-89a4-6d65d4706a39.png)

这是hadoop 版本问题,2.6及以下没有build 方法

模型路径下的quantization.py文件:52与53行之间和62与64行之间分别加入weight = weight.to(torch.float)就可以了 @feyxong