zfxSteven

Results 10 comments of zfxSteven

> 可以考虑反向计算 flow-field grid ok,不太了解这一块,有什么可以参考资料么?以及相关的参数怎样从模型中取到?

> PaddleOCR 3.0 没有这个参数 这个单字符位置还是挺重要的一个功能,有实现计划吗?

人民群众的迫切需求,希望能早点看到

我已经根据模型预测的帧序列简单识别了一版,现在遇到了一个问题: 在一些情况下,需要开启版面裁剪(矫正)来提高识别效果,但是字符位置就无法还原到原图像位置了 有什么处理办法吗?

> > 我已经根据模型预测的帧序列简单识别了一版,现在遇到了一个问题: 在一些情况下,需要开启版面裁剪(矫正)来提高识别效果,但是字符位置就无法还原到原图像位置了 有什么处理办法吗? > > 可以参考 https://github.com/RapidAI/RapidOCR/blob/main/python/rapidocr/main.py#L107 看了一下,并不是图像裁剪(拉伸) 的处理方式,或者UVDoc的,但是还有借鉴意义,感谢~

> PaddleOCR 3.0 没有这个参数 你好, 借鉴了你的项目:https://github.com/GreatV/DocTrPP.git 尝试了项目上的model,效果与UVDOC的有差异 UVDoc不是使用的DocTr++吗? 另外,debug了UVDoc的infer部分,发现并没有透传出 warp filed矩阵的位置,有什么地方可以获得么?

> [@zfxSteven](https://github.com/zfxSteven) uvdoc 估计用的是 doctr 这么说,官方后续支持的return_word_box也是基于版面矫正(如果开了)后的图像来定位字符位置? 看了DocTr,当中还有一个类似warp field的输出,也有一个模型修整阴影光线等 不知道我理解的对不对?

> > [@zfxSteven](https://github.com/zfxSteven) uvdoc 估计用的是 doctr > > 这么说,官方后续支持的return_word_box也是基于版面矫正(如果开了)后的图像来定位字符位置? 看了DocTr,当中还有一个类似warp field的输出,也有一个模型修整阴影光线等 不知道我理解的对不对? > > 论文链接:https://arxiv.org/pdf/2110.12942

如果有需要,可以分享一个半成品

返回的有一个参数,是文字方向,如果急用可以用这个参数反推竖向的单字