汉字结构部件问题

Open JH1112 opened this issue 3 years ago • 1 comments

您好，我使用爬虫获取了汉字部件构造，为什么在weibo数据集resume数据集上都不能达到论文中所描述的结果？ weibo数据集上的f1值平均在0.59左右，resume数据集上f1值也只能在0.94-0.95。还有个问题，数据集中存在繁体字，这部分没有匹配的汉字部件构造，原实验中是否对这部分也进行了拆分，会不会是因为这部分影响了实验的结果？

May 09 '22 13:05 JH1112

您好，我最近也在看这个工作。我想知道汉字部件的文件格式您是怎么设置的。方便的话截个部分图可以吗

Jun 05 '22 15:06 Luxueux