kevinuserdd
kevinuserdd
请问,examples/information_extraction/duuie中的训练测试代码和项目中model_zero/uie下面的训练有什么不同?
显存不足
这么吃显存吗? 8万条训练数据16g就跑不动了
预测
纯文本(无label)文本如何预测? 如果新增的数据,vocab不在原来的数据集里,就会报index out 错误吧?
### 请提出你的问题 本地开发的环境,之前一直运行没问题; 今天再跑模型,就出现以下bug,很奇怪,我也没有重新安装新的版本 /lib/python3.8/site-packages/paddle/fluid/dygraph/layers.py", line 914, in __call__ outputs = self.forward(*inputs, **kwargs) TypeError: forward() takes 3 positional arguments but 5 were given
### Is there an existing issue for this? - [X] I have searched the existing issues ### Current Behavior deepspeed 执行chatglm推理会出现显存成倍的情况,具体如下: deepspeed --num_gpus 2 test.py 服务器环境中有2个gpu,执行推理的时候,会出现显存为2倍参数量。 也就是可以理解为,并deepspeed加载后,并没有完成模型并行,2块gpu都加载了同样参数量,存在显存翻倍的情况。 测试bloom模型并未出现这个情况,具体不知道是不是和模型底层有关,chatglm为什么使用deepspeed推理时候会出现这个问题? ### Expected...
词表合并问题
感谢您使用Issue提问模板,请按照以下步骤提供相关信息。我们将优先处理信息相对完整的Issue,感谢您的配合。 *提示:将[ ]中填入x,表示打对钩。提问时删除上面这两行。请只保留符合的选项,删掉其他。* ### 详细描述问题 *请尽量具体地描述您遇到的问题。这将有助于我们更快速地定位问题所在。* ### 运行截图或log *(如有必要)请提供文本log或者运行截图,以便我们更好地了解问题详情。* ### 必查项目 - [ ] 哪个模型的问题:LLaMA / Alpaca **(只保留你要问的)** - [ ] 问题类型:**(只保留你要问的)** - 下载问题 - 模型转换和合并 - 模型推理问题(🤗 transformers) -...
*提示:将[ ]中填入x,表示打对钩。提问时删除这行。只保留符合的选项。* ### 详细描述问题 *请尽量具体地描述您遇到的问题,**必要时给出运行命令**。这将有助于我们更快速地定位问题所在。* ### 运行截图或日志 *请提供文本log或者运行截图,以便我们更好地了解问题详情。* ### 必查项目(前三项只保留你要问的) - [ ] **基础模型**:LLaMA / Alpaca / LLaMA-Plus / Alpaca-Plus - [ ] **运行系统**:Windows / MacOS / Linux - [...
ValueError: You can't train a model that has been loaded in 8-bit precision on a different device than the one you're training on. ValueError: You can't train a model that...
模型并行只能用python执行吗? torchrun 执行是不是不可以呢? torchrun默认启动多进程
