zhongguogu

Results 8 comments of zhongguogu

@dothinking 是否可以添加个参数,控制是否输出矢量图?

i sovle this problem by update jdk1.8.0_65 to jdk1.8.0_151 . https://www.oracle.com/java/technologies/javase/javase8-archive-downloads.html#license-lightbox

@myhloli 谢谢,打开pdf直接拷贝粘贴是没有问题,试过百度 paddleocr-vl 也是有问题的,但是textin pdflux,pdfbox 是没有问题的

> > [@myhloli](https://github.com/myhloli) 谢谢,打开pdf直接拷贝粘贴是没有问题,试过百度 paddleocr-vl 也是有问题的,但是textin pdflux,pdfbox 是没有问题的 > > 你是双层PDF吗,走管道流模式应该是可以正常解析得,OCR识别生僻字估计是没在字典里得自己训练 不是双层PDF,pipeline模式也是有问题的。

> > [@myhloli](https://github.com/myhloli) 谢谢,打开pdf直接拷贝粘贴是没有问题,试过百度 paddleocr-vl 也是有问题的,但是textin pdflux,pdfbox 是没有问题的 > > 请问pdfux和pdfbox是商用的吗? pdflux是商用的,庖丁科技的付费 pdfbox是apache 开源的

但是把这一页 截图png,https://drive.google.com/file/d/1XDFWXhsJqNL4ZrqIBJVrPnpKJqH1sJrD/view?usp=sharing 效果会好一些,但是还会存在丢失的现象。 源文件: https://drive.google.com/file/d/11taP_aHdUi1TktdkStzKIEhyelzeCxjQ/view?usp=sharing