Rui Wang

Results 33 comments of Rui Wang

yeah,welcome to pull a request~

抱歉,这个暂时没有做过多的研究,是个值得思考的问题呢

@Trueflash 额,问问题的话最好开新的issue,不要总在别的issue里问 负面数据多的话有可能正面的准确率高召回低,一般采用负例采样或者正例加权的方法

That's pretty cool, and I will add the search function later Thanks.

R语言啊,平常用得少,迁移的话工作量还是有点大的,暂时不知道有啥好办法。。

感谢支持!感觉trie或者hash都是比较好的解决方案吧,但是这个似乎和分词没什么关系,trie的话 https://github.com/isnowfy/snownlp/blob/master/snownlp/utils/trie.py 我有实现,现在是用在汉字转拼音的最大匹配上了

明白了,确实可以先分词再扔到trie里面去,keywords的话确实可以考虑搞搞加上词性

可以看coursera上的nlp课,分词的话算法不同其实相关性也不是太大,我实现的那些都有把算法和论文贴出来你可以去查看

@cjboof 有时间看看怎么加一下

@james97 是呢,命名体识别和pos差不多,标注不一样,人民日报里有命名体的标注可以拿来训练,不过我还没有实现crf,在考虑要不要搞个crf还是先用hmm做了