zhparser icon indicating copy to clipboard operation
zhparser copied to clipboard

分词结果不大准确

Open kalxd opened this issue 5 months ago • 0 comments

目前运行在docker postgres:17版本之上,以zhparser提供dockerfile编译出来的新镜像上运行。

测试我来看望大家这句时,分词的结果好像不大对:

# select * from ts_debug('china', '我来看望大家');

 alias |  description   | token | dictionaries | dictionary | lexemes 
-------+----------------+-------+--------------+------------+---------
 r     | pronoun,代词   | 我    | {}           |            | 
 u     | auxiliary,助词 | 来看  | {}           |            | 
 v     | verb,动词      | 望    | {simple}     | simple     | {望}
 r     | pronoun,代词   | 大家  | {}           |            | 
(4 行记录)

它把来看望分解成来看。 请问这种问题有办法解决吗?

kalxd avatar Sep 03 '25 11:09 kalxd