Double_V
Double_V
可否提供下执行预测的代码
感谢反馈,我们尽快排查下,可否提供你使用的develop paddle版本的commit
可以不用标注 > 在后处理时候,在判断英文的部分,给它筛除掉? 另一重保险
readme中公开的论文指标需要用B模式的metric计算方式,A模式的计算方式的标签格式和PPOCR格式相同,但是效果差一些 采用B模式精度评估方式: ``` 下载ground truth : wget https://paddleocr.bj.bcebos.com/dataset/Groundtruth.tar 修改metric部分参数, Metric: name: E2EMetric mode: B # two ways for eval, A: label from txt, B: label from gt_mat gt_mat_dir: ./train_data/Groundtruth/ #...
第二阶段的训练数据是synthtexk150k_irregular,synthtexk150k_curved,ArTV2,Total-tex 数据配比分别是 [0.0023, 0.0070, 0.1653, 0.8254]
安装paddleocr 2.5以上的版本吧
你好啊; > 即:压力测试完之后2分钟内不释放内存,但是过了20分钟左右之后,发现自动释放内存了 麻烦看下后台是否有残留Python进程; enable_mkldnn=True, use_mp=True的问题,如果你自己在写了多进程预测,建议不把use_mp设置为True; 如果是测试,也先把enable_mkldnn=False 内存一直增加是出现了内存泄露;可否提供你的测试代码?我在aistudio上创建了python3.7 + paddle2.3.2 + paddleocr2.6.0.1 测试了510张图像,10进程,没有出现内存泄露和内存没有释放的情况
> paddleocr内存释放的效果图。纵轴是paddleocr占用的内存,横轴是服务端处理完客户端的所有请求(理论上该立马释放内存),但实际是,大约用了500s,才逐渐释放完内存。 如果你是起服务测试,是否是每个服务里都重新初始化了paddleocr.PaddleOCR这个类,这个类是包含模型初始化的,初始化一次后可以重复使用,如果每个进程都初始化确实会导致占据额外的内存 可以使用PaddleOCR的paddleserving部署方式: https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6/deploy/pdserving
预训练模型不对,CML训练需要加载训练好的教师模型,关于PPOCRv3的训练方法参考这个文档:https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/PPOCRv3_det_train.md
根据颜色去掉背景部分,opencv可以实现,可以找找网上的一些教程