andyjiang comments

Results 112 comments of


                                            andyjiang

图片宽度很大，配置ch_PP-OCRv3_rec_distillation.yml 的 image_shape 参数要怎么修改？

配置文件中涉及的image_shape都改一下就好，比如这里 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/configs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml#L169

扫描英文文档怎样逐词(word level)输出结果？

> 如果出现字体不一样的情况这个坐标就对不上了啊。目前只能通过空格来划分，暂时不支持逐词输出的，因为那会需要逐词进行标注，如果有需要可以自己标注数据进行重新训练。

一定报这个错RecursionError: maximum recursion depth exceeded while calling a Python object

提供一下你的label文件看看，可能是换行问题或者部分分隔符不是\t，或者使用这个函数看一下数据读取是否正确 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/tools/train.py#L203

一定报这个错RecursionError: maximum recursion depth exceeded while calling a Python object

label标签格式要统一，如下 ``` 图像路径\t图像标签\n 图像路径\t图像标签\n ``` 可以对label进行检查，看是不是有不合法的

一定报这个错RecursionError: maximum recursion depth exceeded while calling a Python object

应该不会的，这个参数是支持修改的，默认最大长度是25，超过的会自动过滤

一定报这个错RecursionError: maximum recursion depth exceeded while calling a Python object

另外，RecConAug数据增强里面也涉及max_text_length这个参数，注意同步修改，或者不使用该数据增强方式 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/ppocr/data/imaug/rec_img_aug.py#L133

一定报这个错RecursionError: maximum recursion depth exceeded while calling a Python object

> 另外，RecConAug数据增强里面也涉及max_text_length这个参数，注意同步修改，或者不使用该数据增强方式 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/ppocr/data/imaug/rec_img_aug.py#L133 最新版2.6分支代码已经暴露了该参数

一定报这个错RecursionError: maximum recursion depth exceeded while calling a Python object

这是因为v3使用了一个attention 分支，编码期间需要添加开始和结束字符，所以有效字符长度>= max_text_length-1就会过滤，你这里是4位，所以要设置成6

一定报这个错RecursionError: maximum recursion depth exceeded while calling a Python object

嗯嗯，因为正常来说max_text_length这个参数默认是25，会满足大部分文本场景，如果需要适配自己的文本场景，看情况修改即可

French layout recovery

you can try to realize this function according to the Chinese or English model