Bigzhao Tan
Bigzhao Tan
数据地址:https://pan.baidu.com/s/1LBfqT86y7TEf4hDNCU6DpA 密码:qa2u > 可以发一份数据集给我吗?万分感谢,[[email protected]](mailto:[email protected])
> 您好,请问可以发一份数据集给我吗?万分感谢,[[email protected]](mailto:[email protected]) 数据地址:https://pan.baidu.com/s/1LBfqT86y7TEf4hDNCU6DpA 密码:qa2u
> 您好,请问根据本数据集计算idf文件您使用的是什么方式?是单纯的对每个词求math.log(N/n)吗?我是这样单纯计算的,但是整个数据集所花费的时间非常恐怖,想请教一下有由有什么特殊的办法。 是这样做的,当时拿的代码是jieba分词作者提供的,印象中跑的时间不算特别久。 可以参考一下 https://github.com/fxsjy/jieba/issues/393
嗯我已经把所有文件都下载了 报错信息是: ` --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) C:\Anaconda3\lib\site-packages\gensim\models\doc2vec.py in load(cls, *args, **kwargs) 688 try: --> 689 return super(Doc2Vec, cls).load(*args, **kwargs) 690 except AttributeError: C:\Anaconda3\lib\site-packages\gensim\models\base_any2vec.py in load(cls, *args,...
好的好的 感谢回复