hongxia

Results 10 issues of hongxia

我的cppjieba.py ``` #encoding=utf-8 from ctypes import * import os cur_dir = os.path.dirname( os.path.abspath(__file__)) or os.getcwd() lib = cdll.LoadLibrary(cur_dir+'/libJieba.so') lib.Jieba_cut.restype = py_object lib.Jieba_tag.restype = py_object lib.Jieba_extract.restype = py_object class Tokenizer(object): def...

输入vector string , 从分词器中删掉这些词 1. 逻辑上只需要修改trie_是吗 2. 能用trie_里的Find() 与 DeleteNode()来完成这个功能吗 有点看不懂代码... DictUnit,Dag与trie_保存的是什么含义的数据,以及他们的存储结构...?

一个可用python接口代码

我自己就是g++ -o demo demo.cpp 计算了时间,你编译后的demo Cut运行速度快5倍 我不太懂你的Makefile,请问您用了什么参数,我用什么样的命令编译也能这么快吗? 我写了个python版本的接口,生成.so文件,我在想用你的编译方法,能让这个接口的分词速度也快5倍吗? 谢谢!

when i use 6G pure text, 3 threads, max_len=4W, they run out my 120Gmeory+180Gswap. i guess may be some point unfriendly with big data.

一个场景,一个codis放着数据D,然后我在多台机器里起着进程,每个进程里存在这么一份D, 我期望当codis被修改的时候,他们来调一下我的函数,这个函数会重读这个D。 我期望所有harpc控制的进程都执行这样的操作,而不是选一个。

直接用thrift没问题;用HARPC就不行 这个问题对算法上服务影响很大

how list recursively? like bash "tree -L 2"

value本来int也是可以的,self.__getProxy().set(self.__convertKey(key), value) 能跑 但是加了if len(value)判断就要先把value转化为str, 这代码不合适吧?

我的机器是centos 7 gcc version 4.85 可能是什么问题呢