simhash_server icon indicating copy to clipboard operation
simhash_server copied to clipboard

Results 5 simhash_server issues
Sort by recently updated
recently updated
newest added

这样计算出来每篇内容的simhash值,然后进行比对么?我的网站是PHP的,服务器上已经安装了,怎么计算两个值的相似度呢?请问有PHP的计算的代码么?

发送请求“你好世界”,得到17676873585679812141之后怎么与其他的字符串得到的数据进行相似度比较呢?是不是要转换为2进制,可是该怎么转换呢?还有之前我写的Java程序得不到串是因为我的class是gbk编码,改为utf-8编码请求就有效了。

通过post模式,提交的字符长度有限制么?主要对文本的内容进行处理

当前使用simhash_server,发现针对文本进行simhash提取结果为0,下列文本均为这些情况: ``` 抢了这么多u 看这里 假。钞。可。赌。博。 人 照 一 致 才抢这么点U 还有 去抢 搞什么的 对呀 笑不出来 你笑啦? 多还是空 买哪个 说你嘛什么? 怎么会呢 这哪里丑了 ``` 请问作者这是什么原因?