Zhangpeixiang
Zhangpeixiang
@woshi91 想问下你们得模型大么?我predict得时候显示显存不够。。。
同样用了vgg的底层,但是效果很不错
pdf转jpg或者png得话像素是没有损失的,至于你说的漏检问题应该是通用得模型应用到了某个场景,对于size敏感是很正常得,因为是对于提取得特征图得每一个点来生成不同得anchor,训练图片得size跟真实得预测size尽量要保持一致,我是全部resize训练得,这样loss收敛得也快,anchor学习到的regression参数也好,预测也resize到训练得尺寸。
@luckydog5
@luckydog5 CTPN底层改成resnet理论上确实提取得特征会更好,但是我觉得vgg就已经可以取得不错得效果了~
@luckydog5 应该不会吧,我最近做的工程项目中就是用的CTPN,对于拍照、扫描、电子版的照片识别效果都不错,可能你训练的样本不够吧,标签不好?把单个字切断这个是因为你得阈值的设置,太高了就容易将一些anchor cut掉,导致最终的proposal显示的文字不全,漏字这个情况应该是你没有用测试的场景本文进行训练导致的问题。
@luckydog5 感觉preprocessing很重要。可以针对性的做一些preprocessing,对于之后的CRNN预测也很好
@loooong 最近整好在做这方面的项目,已经有不错的效果了,可以做一下任务迁移,qq1321444999
@LingzhiWang2017 在model中结尾添加num_labels=len(label_list)即可
@Aurora11111 have u train ctpn ?