chinese_ocr icon indicating copy to clipboard operation
chinese_ocr copied to clipboard

CTPN + DenseNet + CTC based end-to-end Chinese OCR implemented using tensorflow and keras

Results 106 chinese_ocr issues
Sort by recently updated
recently updated
newest added

![Snipaste_2021-06-01_21-35-54](https://user-images.githubusercontent.com/61728321/120332525-69b8fc00-c321-11eb-8c2d-8d981495b102.png)

model.compile(loss={'ctc': lambda y_true, y_pred: y_pred}, optimizer='adam', metrics=['accuracy']) 你好,想问一下,train.py中,168行,这里的loss,返回的为什么是 lambda y_true, y_pred: y_pred。这个的意思不就是返回y_pred的值呢。 这里不是应该写model.compile(loss={'ctc':loss_out}, optimizer='adam', metrics=['accuracy']) 期待您的回答

大佬你好,我使用了你的训练集来训练我自己的模型,准确率很高,但是实际使用中只有与测试集相似的10个字符的图片能正确的识别出来,一旦字符大于10个或小于10个结果就会变得非常差,且模型依然回输出十个字符。 请问你遇到过这种情况么,是如何解决的呢?

这是densenet测试了十几万张图片之后报的错 2019-01-23 19:51:42.943120: F tensorflow/stream_executor/cuda/cuda_dnn.cc:542] Check failed: cudnnSetTensorNdDescriptor(handle_.get(), elem_type, nd, dims.data(), strides.data()) == CUDNN_STATUS_SUCCESS (3 vs. 0)batch_descriptor: {count: 1 feature_map_count: 128 spatial: 4 0 value_min: 0.000000 value_max: 0.000000 layout: BatchDepthYX}...

弱弱的问一个非常重要的问题. 那么是不是设置好最大长度就行了? 只要训练宽度固定就行?

您好,我想重新训练一下ctpn,下载了您提供的VOC2007数据集之后,split_label.py中的path = '/media/D/code/OCR/text-detection-ctpn/data/mlt_english+chinese/image'和gt_path = '/media/D/code/OCR/text-detection-ctpn/data/mlt_english+chinese/label'的路径应该对应/VOC2007/JPEGImages 和 /VOC2007/Annotations 两个文件夹的路径吗? 我修改之后产生错误如下: File "./chinese_ocr-master/ctpn/prepare_training_data/split_label.py", line 43, in pt_x[0, 0] = int(float(splitted_line[0]) / img_size[1] * re_size[1]) ValueError: could not convert string to float: ''...

请问作者 数据集中的chinese datasets 有对应的label文件吗,谢谢!

您好,想向您请教一下densnet训练模型时,data_train.txt中20455828_2605100732.jpg 263 82 29 56 35 435 890 293 126 129,图片后面的10个数是什么意思呢,感觉也不像坐标或者词向量,期待您慷慨解答,谢谢!