1042312930
1042312930
> Any Updates on this? I'm running into same error i find this in https://github.com/Layout-Parser/layout-parser/issues/15 
爬取某某公司员工数量
“栅极”是啥 super☆boy ***@***.*** ------------------ 原始邮件 ------------------ 发件人: ***@***.***>; 发送时间: 2023年6月28日(星期三) 下午4:37 收件人: ***@***.***>; 抄送: ***@***.***>; ***@***.***>; 主题: Re: [dongrixinyu/jiojio] 【数据】若分词效果不好,请将效果不好的文本数据提交至这里 (Issue #4) 这种问题的原因就是“栅极”的上下文不一样,前后字词不同,导致特征不同,结果也就不一样。 想要自己训练的话,需要有充足的 cpu 核,因为这个不依赖 GPU,自训练需要高质量的数据,成本还是比较高的。如果你感兴趣, 库里有 training.py 文件可以用于训练。当然,可能你在执行的时候遇到一些bug。 我可以提供付费有偿指导。...
我也遇到了 cannot import name 'convert_files_to_dicts_splitter' from 'pipelines.utils.preprocessing
That's really great😀