Wang Zirui
Wang Zirui
Quanteda is the best text analysis tool in the world. I really hope that Quanteda's workflow can implement rolling stylometry analysis one day
The tutorial is not clear:https://quanteda.io/reference/docnames.html
> This should still work fine. If you can supply a reproducible example using `reprex::reprex()` I can examine this further. I found some guy meet the same issue like me...
same question.
https://mp.weixin.qq.com/s/wvzky3Gj5wC2ymQxyvHSqA?scene=0&subscene=90 公众号似乎就是官网
> We will release 1.0.0 later, please check whether this persists in the latest version.我们将稍后发布 1.0.0 版本,请检查此问题是否在最新版本中仍然存在。 persist in the latest version
I think this is a good topic I recently tried to modify your repository with windsurf, but the effect was not good. Because there are currently many one-to-two bilingual corpora...
enhancing export 导出为 OpenOffice 似乎是正常的,但是 word 不行……
我们做笔译经常用的是 trados、 还有云译客,不过都是闭源的 此链接下的云译客亦是闭源https://transpace.iol8.com/home。
另外,现在正如上所述,许多笔译翻译项目都要用cat工具,但这些工具大多闭源、老旧,但是cat工具也有其一些优点,术语统一、翻译记忆库,可以保持pdf样式的优点。PDFMathTranslate翻译的产物面向的是简单阅读那么可以不必参考,但是如果能多迈前一步,能加入cat工具的各种功能(用户可以自主编辑翻译文本的错误),那么将会从“简单阅读”到“出版物级阅读”升级。 不过似乎样式错乱导致的原因似乎是pdf的文本层与 PDFMathTranslate识别的文本层不统一有关。 但是不知道现在中文ocr是如何的,是否可以精准为pdf的文本画框?(不太懂如何描述),如果在翻译这些文本层前,用户有机会查看 PDFMathTranslate识别的文本层是否是正常的,那就避免了许多token浪费。