zfxSteven comments

Results 10 comments of


                                            zfxSteven

已有det_ploy，怎样还原裁剪前的位置

> 可以考虑反向计算 flow-field grid ok，不太了解这一块，有什么可以参考资料么？以及相关的参数怎样从模型中取到？

return_word_box参数出错

> PaddleOCR 3.0 没有这个参数这个单字符位置还是挺重要的一个功能，有实现计划吗？

return_word_box参数出错

我已经根据模型预测的帧序列简单识别了一版，现在遇到了一个问题：在一些情况下，需要开启版面裁剪（矫正）来提高识别效果，但是字符位置就无法还原到原图像位置了有什么处理办法吗？

> > 我已经根据模型预测的帧序列简单识别了一版，现在遇到了一个问题：在一些情况下，需要开启版面裁剪（矫正）来提高识别效果，但是字符位置就无法还原到原图像位置了有什么处理办法吗？ > > 可以参考 https://github.com/RapidAI/RapidOCR/blob/main/python/rapidocr/main.py#L107 看了一下，并不是图像裁剪（拉伸）的处理方式，或者UVDoc的，但是还有借鉴意义，感谢~

return_word_box参数出错

> PaddleOCR 3.0 没有这个参数你好，借鉴了你的项目：https://github.com/GreatV/DocTrPP.git 尝试了项目上的model，效果与UVDOC的有差异 UVDoc不是使用的DocTr++吗？另外，debug了UVDoc的infer部分，发现并没有透传出 warp filed矩阵的位置，有什么地方可以获得么？

return_word_box参数出错

> [@zfxSteven](https://github.com/zfxSteven) uvdoc 估计用的是 doctr 这么说，官方后续支持的return_word_box也是基于版面矫正（如果开了）后的图像来定位字符位置？看了DocTr，当中还有一个类似warp field的输出，也有一个模型修整阴影光线等不知道我理解的对不对？

return_word_box参数出错

> > [@zfxSteven](https://github.com/zfxSteven) uvdoc 估计用的是 doctr > > 这么说，官方后续支持的return_word_box也是基于版面矫正（如果开了）后的图像来定位字符位置？看了DocTr，当中还有一个类似warp field的输出，也有一个模型修整阴影光线等不知道我理解的对不对？ > > 论文链接：https://arxiv.org/pdf/2110.12942

return_word_box参数出错

如果有需要，可以分享一个半成品

return_word_box参数出错

返回的有一个参数，是文字方向，如果急用可以用这个参数反推竖向的单字