Han-Cheol Cho
Results
2
comments of
Han-Cheol Cho
Hi @kame-hameha , I faced the same issue and solved the problem based on the following pytorch discussion post: * https://discuss.pytorch.org/t/solved-keyerror-unexpected-key-module-encoder-embedding-weight-in-state-dict/1686/14 In short, a model trained with `nn.DataParallel` have state...
Parallelized ARDM에서 어느 t에서 몇개를 인퍼런스할 것인가는 입력 데이터를 디코딩해가면서 변형된 dijkstra 알고리즘을 사용해서 동적으로 알아내는 방법을 쓰더라구요. 이논문에서는 설명이 부족해서 watson 2021 논문 봐야 재대로 나오더군요 ㅋ