vs0533
vs0533
我也遇到这个问题了 请问你解决了吗 能否告知解决方案?
神经网络灾难性遗忘 这个问题现在解决不了 甭讨论了
max_source_length+ max_target_length = PRE_SEQ_LEN
> > 可以修改一下这个函数, utils.py里面: > > ```python > > def auto_configure_device_map(num_gpus: int) -> Dict[str, int]: > > # transformer.word_embeddings 占用1层 > > # transformer.final_layernorm 和 lm_head 占用1层 > > #...
Me too