Could we add new words?
E.g. if a word (北大) is not recognized as an organisation, could we add this word to let the model know this word?
E.g. if a word (北大) is not recognized as an organisation, could we add this word to let the model know this word?
of course, you can add 北/B_org 大/E_org into the train set.
@buppt thanks 有个疑问 tensorflow那个是 先python train.py 然后再python train.py pretrained 吗
@buppt thanks 有个疑问 tensorflow那个是 先python train.py 然后再python train.py pretrained 吗
不用,python train.py是不使用预训练词向量的训练,python train.py pretrained 是使用预训练的词向量训练。
恩 O(∩_∩)O谢谢 还有个疑问 这个怎么增量数量的 每次的新句子都要加在前面那个训练集吗 然后重新跑一次train吗
@buppt 这个train.py 会被执行吗 elif len(sys.argv)==3: 看了很久都没有看到过有输入3个参数的 冗余代码吗 谢谢
恩 O(∩_∩)O谢谢 还有个疑问 这个怎么增量数量的 每次的新句子都要加在前面那个训练集吗 然后重新跑一次train吗
什么意思,是想自己加一些实体的例句?放训练集里或者在训练好的模型基础上继续训练都可以。 三个参数不是文件名那个么,readme里有。
@buppt 恩 原来是我看漏了 原来还有个文件批处理的 谢谢 , 有比较详细的步骤 ,现在我已经跑完了train.py 如果要加新的语料训练 在现在模型基础 继续训练 要执行那个命令呢 谢谢
谁能提供一下TensorFlow训练的模型
你训练不了吗 用显卡大概3个小时
说一下我遇到的问题哈,
cd data/renMinRiBao/
python data_renmin_word.py
然后 cd tensorflow/
python train.py pretrained
然后报错如下:
train len: 24271
test len: 7585
word2id len 3917
Creating the data generator ...
Finished creating the data generator.
use pretrained embedding
begin to train...
Traceback (most recent call last):
File "train.py", line 107, in
@bobkentt 你看一下你的 语料是不是有问题 是你自己编写的吗
@bobkentt 你看一下你的 语料是不是有问题 是你自己编写的吗
就是把项目直接clone下去啊,没用自己的语料,难到是我TensorFlow版本的问题?你是啥版本的啊?我这俩虚拟机安装的tf环境,版本分别是:1.10.0 1.12.0 都不行
train.py 中改成int64也不行,同时也试了把数据label强转成int32
你重新训练前 有将前面训练好的模型文件删掉吗 我用的是tensorflow-gpu==1.10.0
@bobkentt
@bobkentt 类型转为int32就可以了
self.viterbi_sequence, viterbi_score = tf.contrib.crf.crf_decode(tf.cast(bilstm_out, dtype=tf.int32), tf.cast(self.transition_params, dtype=tf.int32), tf.cast(sequence_length, dtype=tf.int32))