Charlotte comments

Results 26 comments of


                                            Charlotte

Would you consider adding TSN as well?

> > > 你用的是小黄鸡的语料吗？调整一下桶的大小，根据语料的长度来调整请问桶的大小怎么改呢？seqgen的方法是在conf里调整buckets吗？但是我看是一个list，具体是啥含义呢？

我训练出的回答也只有表情符号，请问是怎么回事呢？你解决了吗…… 之前好多编码问题都解决了，现在字典也不为空了，train和test里的query和answer也不全是3了……

> > > 你解决了吗？我用小黄机的语料训练出来只有笑脸没……自己重写了一个，你可以看下我的主页_(:з」∠)_

Could you please tell me how long does it take to finish the training?

`vocab_build`方法你有改过吗？ ``` elif ('\u0041'

可以参考一下我fork的版本，改成了英文可用的，支持自定义标签，python 2.7.5下跑通。https://github.com/coranholmes/zh-NER-TF

我好像就用的默认参数没怎么调就用了原作者默认的，除了输入格式以外模型我好像也没怎么改，效果还行啊……你把错误的那些数据打出来看看错的是哪些？不知道你用的标注数据集质量如何？用的是有名的标注数据集还是自己的数据呢？如果是自己的数据集可能会有一些bias。

我的猜测是因为B-PER这个tag在数据中整体占比偏小，大部分都是O，所以模型倾向于给数据标注O，所以你的recall极低，这样可能需要更改一下loss函数，我记得issue里有人问过这个问题，作者有回复，你看看吧。

因为evaluation的时候调用的是一个.pl文件，系统内需要安装perl才可以运行，安装后还需设置环境变量。