Charlotte
Charlotte
Would you consider adding TSN as well?
> > > 你用的是小黄鸡的语料吗?调整一下桶的大小,根据语料的长度来调整 请问桶的大小怎么改呢?seqgen的方法是在conf里调整buckets吗?但是我看是一个list,具体是啥含义呢?
我训练出的回答也只有表情符号,请问是怎么回事呢?你解决了吗…… 之前好多编码问题都解决了,现在字典也不为空了,train和test里的query和answer也不全是3了……
> > > 你解决了吗?我用小黄机的语料训练出来只有笑脸 没……自己重写了一个,你可以看下我的主页_(:з」∠)_
Could you please tell me how long does it take to finish the training?
`vocab_build`方法你有改过吗? ``` elif ('\u0041'
可以参考一下我fork的版本,改成了英文可用的,支持自定义标签,python 2.7.5下跑通。https://github.com/coranholmes/zh-NER-TF
我好像就用的默认参数没怎么调就用了原作者默认的,除了输入格式以外模型我好像也没怎么改,效果还行啊……你把错误的那些数据打出来看看错的是哪些?不知道你用的标注数据集质量如何?用的是有名的标注数据集还是自己的数据呢?如果是自己的数据集可能会有一些bias。
我的猜测是因为B-PER这个tag在数据中整体占比偏小,大部分都是O,所以模型倾向于给数据标注O,所以你的recall极低,这样可能需要更改一下loss函数,我记得issue里有人问过这个问题,作者有回复,你看看吧。
因为evaluation的时候调用的是一个.pl文件,系统内需要安装perl才可以运行,安装后还需设置环境变量。