SinGaln
Results
2
issues of
SinGaln
您好,在simbert_model.py文件中117行的self.decoder()是哪里来的呢??
您好,看了您关于GAU的代码,发现您的代码中并没有scale_offset的相关代码。 `def scale_offset(x): gamma = var(x.shape[−1:]) beta = var(x.shape[−1:]) return x ∗ gamma + beta def attn(x, v, s=128): z = dense(x, s) q, k = scale_offset(z), scale_offset(z) qk =...