WechatExporter icon indicating copy to clipboard operation
WechatExporter copied to clipboard

导出的消息会有乱码

Open TheWaWaR opened this issue 6 months ago • 3 comments

程序版本:Version 1.9.5.13

非常感谢作者写出这么棒的程序。导出非常快而且导出的 html 显示效果非常棒!

但是我发现导出的内容中,时不时会出现一些如下的乱码:

(�/�a�

看上去没什么规律,消息由纯文字,有带 emoji 的,有长有短。

目前正在尝试编译这个项目 debug 看看

TheWaWaR avatar Jul 19 '25 09:07 TheWaWaR

编译有问题可以讨论的 缺依赖库的话 告诉我 我发给你 最近是没有时间调试了 [捂脸]

Best regards, Matthew

在 2025年7月19日,下午5:15,LingFeng @.***> 写道:

 [https://avatars.githubusercontent.com/u/1160419?s=20&v=4]TheWaWaR created an issue (BlueMatthew/WechatExporter#202)https://github.com/BlueMatthew/WechatExporter/issues/202

非常感谢作者写出这么棒的程序。导出非常快而且导出的 html 显示效果非常棒!

但是我发现导出的内容中,时不时会出现一些如下的乱码:

(�/�a��

看上去没什么规律,消息由纯文字,有带 emoji 的,有长有短。

目前正在尝试编译这个项目 debug 看看

— Reply to this email directly, view it on GitHubhttps://github.com/BlueMatthew/WechatExporter/issues/202, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AI6VD2BIQPBONJSK2VIMAP33JIECRAVCNFSM6AAAAACB4MVREWVHI2DSMVQWIX3LMV43ASLTON2WKOZTGI2DKMJUGAYDGMA. You are receiving this because you are subscribed to this thread.Message ID: @.***>

BlueMatthew avatar Jul 20 '25 00:07 BlueMatthew

乱码是因为消息被用zstd (Zstandard)算法压缩后导致的,每条乱码的消息都会有WCDB_CT_Message=2,而且消息字段的blob都以0x28b52ffd开头(Zstandard compressed file magic number);把整个字段保存下来用file命令可以得到"zstandard compressed data (v0.8+) dictionary id 5" https://github.com/Tencent/wcdb/wiki/Java%7CKotlin-%E6%95%B0%E6%8D%AE%E5%8E%8B%E7%BC%A9

不过不清楚压缩用的字典存储在哪,没找到

Fuhy avatar Oct 04 '25 07:10 Fuhy

请问这个问题如何解决,大佬们 @BlueMatthew @Fuhy @TheWaWaR @

lhuang9703 avatar Dec 03 '25 05:12 lhuang9703

我也遇到了这个问题。

lonelylingoes avatar Dec 14 '25 02:12 lonelylingoes