MECT4CNER
MECT4CNER copied to clipboard
Code for ACL 2021 paper. MECT: Multi-Metadata Embedding based Cross-Transformer for Chinese Named Entity Recognition.
请问我想在torch1.6的版本中训练模型,我需要怎么修改代码呢,或者修改哪里的代码呢
MSRA数据集
File "D:\pythonProject\MECT4CNER\model.py", line 122, in forward char_encoded = self.char_encoder(components_embed, embedding, embedding, seq_len, lex_num=lex_num, pos_s=pos_s, File "D:\anaconda\lib\site-packages\torch\nn\modules\module.py", line 1110, in _call_impl return forward_call(*input, **kwargs) File "D:\pythonProject\MECT4CNER\Modules\TransformerEncoder.py", line 47, in forward output...
汉字拆字字典
请问大佬是如何得到新华字典的部首呢?有什么方法可以获得授权么?如果可以的话可以单独发一份给我嘛~
汉字结构部件问题
您好,我使用爬虫获取了汉字部件构造,为什么在weibo数据集resume数据集上都不能达到论文中所描述的结果? weibo数据集上的f1值平均在0.59左右,resume数据集上f1值也只能在0.94-0.95。 还有个问题,数据集中存在繁体字,这部分没有匹配的汉字部件构造,原实验中是否对这部分也进行了拆分,会不会是因为这部分影响了实验的结果?
训练结果
微博数据集 FitlogCallback evaluation on data-test: SpanFPreRecMetric: f=0.577723, pre=0.591479, rec=0.564593 label_acc: acc=0.957026 Evaluation on dev at Epoch 50/50. Step:6750/6750: SpanFPreRecMetric: f=0.627097, pre=0.629534, rec=0.624679 label_acc: acc=0.961509 In Epoch:48/Step:6480, got best dev performance:...
Trainer训练完成后,使用torch.load,无法加载保存下来的模型 报错: ``` ModuleNotFoundError: No module named 'model' ``` 我查看了Fastnlp中Trainer保存best model的代码,是 ``` model.cpu() torch.save(model,model_path) ``` 使用torch.load应该没有问题的,请问作者大大怎么加载训练完成的best model
dataset: msra The rest is configured according to the readme section, Why the result is not good? ^_^ please~ FitlogCallback evaluation on data-test: SpanFPreRecMetric: f=0.536364, pre=0.553125, rec=0.520588 label_acc: acc=0.957234 Evaluation...
后续改进
您好,看了您的文章收获很大,十分感谢。请问实验部分中BERT-MECT是怎么联合起来的,是把bert的输出放在了lattice embedding中吗。后续可以在原有基础上加对应的模块吗
是在哪个地方用到了flat模型
请问下作者分割数据集ontonotes与msra时怎么限制到长度200呢,是直接比较分割的吗?谢谢