embedding_study icon indicating copy to clipboard operation
embedding_study copied to clipboard

中文词向量训练的问题

Open Larry955 opened this issue 5 years ago • 0 comments

你好,我用于测试的中文数据格式如下: image 每行是一个已经分词的句子

word表的大小是9w,char表的大小是3600 ELMo的batch_size是128(原配置是1024,但是我机器不行,改成128了),其他不变,跑出来的结果是这样: image

损失没啥问题,但是精度最高只有1点几。。。想问下这个是哪里的问题?

我按照你的代码写的是这样的: image

另外,我现在训练好模型后,怎么获取到中文词向量呢?

万分感谢!

Larry955 avatar Dec 10 '20 07:12 Larry955