GitHubwwZ

Results 3 comments of GitHubwwZ

> Hi, you can change the pretrained models to Chinese version in the [training stage](https://github.com/declare-lab/RelationPrompt#model-training--): > > eg "gpt2" -> "ckiplab/gpt2-base-chinese" eg "facebook/bart-base" -> "fnlp/bart-base-chinese" 请问有支持中文训练的数据集嘛?

> 有支持中文的模型吗 方便添加一下您的联系方式,和您探讨一下中文关系三元组抽取任务嘛? 谢谢啦~

> 首先感谢您的代码! > > 在按照您提供的数据集格式替换了自己的输入及训练数据后,最终得到的预测文件中存在测试标签偏移的情况(如图,“深”应为B-ORG,此处为test集原标签),查找源代码后发现,output文件中原预测标签(all_ori_labels)来自utils.get_Dataset的第一个返回examples(来自get_examples),是对BIO格式文件做的一个简单读取(取左列为token,取右列为label)。 > > 我猜测可能是因为该读取未为all_ori_labels中的每个句子添加标记,导致ori_labels的开头与结尾较ori_tokens及prel缺少两个标签,因此在最后输出文件跳过标签时,吞掉了all_ori_labels第一个字的标签。不过,在训练过程中,并未引用到get_examples,而是使用了添加过这些标签的TensorDataset(),所以应该不会结果产生其他影响=) > > 也许您能告诉我是否是我错误注释掉了某部分代码,或有其他忽略的细节导致的错误 ![image](https://private-user-images.githubusercontent.com/131847193/274258779-da5966ae-fd43-4b75-a0aa-4ce1bba3ecb5.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MDM5MzczNTYsIm5iZiI6MTcwMzkzNzA1NiwicGF0aCI6Ii8xMzE4NDcxOTMvMjc0MjU4Nzc5LWRhNTk2NmFlLWZkNDMtNGI3NS1hMGFhLTRjZTFiYmEzZWNiNS5wbmc_WC1BbXotQWxnb3JpdGhtPUFXUzQtSE1BQy1TSEEyNTYmWC1BbXotQ3JlZGVudGlhbD1BS0lBVkNPRFlMU0E1M1BRSzRaQSUyRjIwMjMxMjMwJTJGdXMtZWFzdC0xJTJGczMlMkZhd3M0X3JlcXVlc3QmWC1BbXotRGF0ZT0yMDIzMTIzMFQxMTUwNTZaJlgtQW16LUV4cGlyZXM9MzAwJlgtQW16LVNpZ25hdHVyZT1hY2M2ZWM4ZTA5MjkyZmNmZmRhZTgxYWQ5Yjc2YTk5NTUxNmZiMTU5MTk0MDM4NWRiMzljMjYwNjFjNWU2NThkJlgtQW16LVNpZ25lZEhlYWRlcnM9aG9zdCZhY3Rvcl9pZD0wJmtleV9pZD0wJnJlcG9faWQ9MCJ9.zFzVzpgSfASWmZ-sgAJKSMJfJo55x9l7iGcmURmGeOA) 请问问题解决了吗,我这里运行也有相同的问题。