EurekaTesla
EurekaTesla
非常感谢作者提供的解决方案,我已经修改好了该错误。我就粗浅得补充一下,在utils.py中`if ord(ch) not in self.dict.keys():`下一行加入`print(ch.encode('utf-8'))`,然后就可以在报错的时候输出缺少的字符,将这个字符都写入到alphabet.pkl(里面是一个列表,保存着中英文和符号等字符集)中,就可以解决这个问题。我训练的是好未来手写体英文数据集,虽然不知道为啥会有'\xc2'和'\xad',但是在alphabet.pkl中加入之后就解决了这个问题。我想alphabet.pkl中应该没有您用的藏语字符,需要您添加进去。
我又来补充了。 在utils.py的110行`self.alphabet.append(ocr('_'))`,如果你的标签中含有 _ 字符就需要注意了,标签开头 _ 导致无法正常获取标签值,所以把 _ 改为其他特殊字符(不会出现在你的标签中的字符)
> 咱们这个框架的crnn部分,train.py train_python_ctc.py keys.py recognizer.py 麻烦大家解释一下这几个的用法呀,我在训练中文的时候出现损失特别大 你迭代了几次?
你可以pip install example 然后运行 但是速度慢(尤其是大图片),时不时报维度错误
您好,请问能提供下修改后的完整的text_rec.cpp文件吗?我刚接触C++一周,不太熟悉您说的具体修改内容,尤其是析构函数那块
> 尝试了,在原有镜像上添加CUDA和cudnn后,用他那个异步的embedding和rerank代码就很快,并发也不错。感觉就是故意的哈哈哈哈 我最近也在研究这个,能向您请教一下具体实现的步骤和设置吗?