Cestbon123
Cestbon123
给您发了邮件,可能没看到,#76问题里面这个错误您后面是怎么解决的,能方便说一下吗
How to use the trained model
训练的一些疑问
整个代码我试过了,CPU版本可以运行,照着readme执行就行了,感谢您的工作。主要有以下几个疑问: 1.关于GPU版本,我下载了tensorflow-gpu=2.0.0,然后在train_gpt2_keras.py里面加上了os.environ['CUDA_VISIBLE_DEVICES']='1',运行后代码好像也找到了GPU,但是提示系统显存超出了10%,直接开始训练,我查看GPU的使用情况发现并没有用到,他是发现超过显存后自动使用了CPU训练吗,我看了下语料只有1.3M,生成的tokenized只有700多k,这样的数据8G显存还不够吗?还是其他的原因。 2.我用CPU也训练了48个epoch,第一个epoch有11个steps,后面每个epoch只有1个steps,而且训练的loss有7000多,我想知道您当时训练也是这种情况吗?大概需要训练多少个epoch才可以。 3.train_gpt2_keras.sh里面 好像并不需要这两个参数--epochs 10 \ --steps_per_epoch 100 \,而且代码里面好像没有设置epoch的次数。我把这两个参数删除后才不报错,但是会一直训练,想知道您当时是怎么做的。
from ..nn.mobilenet_v2 import InvertedResidual这个您是从哪导入的