wangxggc comments

Results 9 comments of


                                            wangxggc

哦，这个没有用那种方法，实际训练的时候发现，直接截取一个适中的句子长度对于训练也可以得到满意的效果，打个不恰当的比方，LSTM最多记忆30个特征的句长，句子长度大于30的时候，对于记忆信息反而帮助不大；再者，对于句子长度小于30的句子，直接补全到30对于计算的性能也没有太大影响。 PS，你可以自己尝试一下根据Min-Batch内最大句长设置Padding呀，Theano的scan函数需要稍作修改。

how do you feel if I create a new project based on your code>?

Yeah, you can email me with email address [email protected]

输入格式及输入数据问题

嗯啊，训练的时候 python train.py -t 训练文件测试文件字典类别权重（可以写成 None）模型文件存放位置，建议写成（你的文件夹/lstm.model）比如：python -t train.txt test.txt dic.txt None my_dir/lstm.model 数据格式挺简单的呀，一行一组数据，标签\t句子1\t句子2，\t 是制表符比如： 0\t大马路上\t你要去哪...