andyjiang

Results 112 comments of andyjiang

配置文件中涉及的image_shape都改一下就好,比如这里 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/configs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml#L169

> 如果出现字体不一样的情况这个坐标就对不上了啊。 目前只能通过空格来划分,暂时不支持逐词输出的,因为那会需要逐词进行标注,如果有需要可以自己标注数据进行重新训练。

提供一下你的label文件看看,可能是换行问题或者部分分隔符不是\t,或者使用这个函数看一下数据读取是否正确 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/tools/train.py#L203

label标签格式要统一,如下 ``` 图像路径\t图像标签\n 图像路径\t图像标签\n ``` 可以对label进行检查,看是不是有不合法的

应该不会的,这个参数是支持修改的,默认最大长度是25,超过的会自动过滤

另外,RecConAug数据增强里面也涉及max_text_length这个参数,注意同步修改, 或者不使用该数据增强方式 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/ppocr/data/imaug/rec_img_aug.py#L133

> 另外,RecConAug数据增强里面也涉及max_text_length这个参数,注意同步修改, 或者不使用该数据增强方式 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/ppocr/data/imaug/rec_img_aug.py#L133 最新版2.6分支代码已经暴露了该参数

这是因为v3使用了一个attention 分支,编码期间需要添加开始和结束字符,所以有效字符长度>= max_text_length-1就会过滤,你这里是4位,所以要设置成6

嗯嗯,因为正常来说max_text_length这个参数默认是25,会满足大部分文本场景,如果需要适配自己的文本场景,看情况修改即可

you can try to realize this function according to the Chinese or English model