Kakk7447
Results
3
comments of
Kakk7447
开发者您好,我在PLE原文中看到,构造PLE网络主要是两部分:Multi-level Extraction Networks,以及上层的PLE network。在Multi-level Extraction Networks中,提到了门控网络不仅仅包含针对于特定任务的门控网络,还有一个共享专家的门控网络。原文如下:'Besides gates for task-specific experts, the extraction network also employs a gating network for shared experts to combine knowledge from all experts in this layer.'...
谢谢您的回答!祝好
我也在使用这个代码,想问一下您使用早停法了吗?对于一个分类任务和一个回归任务,早停法应该如何设定呢?