dothinking
dothinking
Much appreciated if you could contribute to this topic. Hope the comments below can help you. https://github.com/ArtifexSoftware/pdf2docx/issues/145#issuecomment-1171414635 https://github.com/ArtifexSoftware/pdf2docx/issues/165#issuecomment-1270043721
上游库 `pdf2docx` 的问题,已在`0.5.7`版本中修复。 ``` pip install pdf2docx --upgrade ```
Hi SijaanX, Thanks for your comments. > Why it doesn't support languages that are written from right to left? Because there are known issues on rtl languages that I couldn't...
Thanks for providing test file. This is a planned feature (straight line), but unfortunately, it is not supported yet, and might take some time.
感谢提出问题及测试文件。 > 1. 会将流程图的框架转为图片,而文字在图片后面 这是目前设定的处理方式。`pdf2docx`做不到在Word中创建类似的流程图,而是整体转为背景图片,然后把文字“拼”在对应的位置。也就是你第一张图中展示的效果。 > 2. 流程图整体转为一张图片,但在图片后面会有和图片相同的文字重叠在一起 使用最新版`v0.5.8`测试,结果和上一条一样,不带重叠的文字。估计是之前版本的问题。
> 我目前使用的就是v0.5.8,您看下图二位置的转换情况:文字是拼在了对应的位置,但是整体转为的背景图片也是包含文字的,这个和第一张图情况不同 你是对的,抱歉一开始我是用本地代码测试的,相比`v0.5.8`刚好修复了你的问题。请先测试下面的临时修复版本,没问题的话后面通过`v0.5.9`发布。谢谢。 安装方法:下载和解压附件,然后安装(注意指向whl文件的路径) ``` pip install your/path/to/pdf2docx-0.5.8a1-py3-none-any.whl ``` [pdf2docx-0.5.8a1-py3-none-any.whl.zip](https://github.com/ArtifexSoftware/pdf2docx/files/14076173/pdf2docx-0.5.8a1-py3-none-any.whl.zip)
抱歉这么久才处理。请问方便提供截图的那一页PDF吗?谢谢。
抱歉这么久才回复,请问方便提供输入文件吗?谢谢。
> 一些PDF文档在转化为docx后,其中一些文字存在自动换行的情况 字体名称解析错误的原因,导致docx中字体不一样字符占据宽度也就不一样,但是却是按照PDF中文本的宽度来限制docx中行的宽度,导致换行。这个问题已经在 `v0.5.8` 中解决。通过 `pip instal pdf2docx --upgrade` 升级即可。 > 另外一些段落在转化后首行没有缩进 这个是段落解析的问题。那两段文字被错误当成一个段落,因此丢失本应该是第二个段落开头的缩进。这个问题会在接下来处理。
感谢提议,已加入开发列表。