zengshao0622
zengshao0622
目前尚未提供对应的代码和模块,但是您的建议很重要,后续我们会考虑添加
What about the BEiTv2 ViT- B/16?
是训练阶段就是用单通道的输入吗?
如果训练阶段会将单通道的灰度图转成三通道的输入,可以将配置文件里的DataLoader.transform_ops.DecodeImage.backend设置为"pil"。如果训练阶段就使用单通道的输入,就需要自行实现对应的Dataloader了,并且组网代码可能也要修改。
请问具体是希望使用哪项功能呢?
这种具体应用场景比较少大型的公开数据集,建议到一些比赛或者开源项目里找找
怀疑是环境问题,建议测试一下其他功能,确认一下PaddlePaddle和PaddleClas是否安装正确。
可以参考一下[环境安装文档](https://github.com/PaddlePaddle/PaddleClas/blob/release/2.5/docs/zh_CN/installation.md)
使用whl包进行predict,对输入的预处理中包含了Normalize操作,具体可以参考配置文件:https://github.com/PaddlePaddle/PaddleClas/blob/release/2.5/deploy/configs/inference_cls.yaml#L21