CAN icon indicating copy to clipboard operation
CAN copied to clipboard

请教关于预测的问题

Open yazheng0307 opened this issue 3 years ago • 12 comments

你好,我想测试一下模型在印刷体公式识别上的效果,测试的ExpRate达到0.8,但是另外使用外来的图片预测的时候,结果总是一串相同的字符,这会是什么原因引起的呢?

输入图片: 00000495

程序结果: 92959e6c1ddf7e6c0be4ba116882d78

yazheng0307 avatar Nov 21 '22 02:11 yazheng0307

请问一下,你的印刷体公式数据集是使用的IM2LATEX-100K这个数据集吗?如果是使用印刷体公式的数据集来训练模型需要修改什么参数吗?谢谢

SuperHHzy avatar Nov 21 '22 05:11 SuperHHzy

用的数据集是IM2LATEX-100K的子集,需要改config里面的字典长度,根据自己的数据集字典长度修改

请问一下,你的印刷体公式数据集是使用的IM2LATEX-100K这个数据集吗?如果是使用印刷体公式的数据集来训练模型需要修改什么参数吗?谢谢

用的数据集是IM2LATEX-100K的子集,需要改config里面的字典长度,根据自己的数据集字典长度修改

yazheng0307 avatar Nov 21 '22 06:11 yazheng0307

用的数据集是IM2LATEX-100K的子集,需要改config里面的字典长度,根据自己的数据集字典长度修改

请问一下,你的印刷体公式数据集是使用的IM2LATEX-100K这个数据集吗?如果是使用印刷体公式的数据集来训练模型需要修改什么参数吗?谢谢

用的数据集是IM2LATEX-100K的子集,需要改config里面的字典长度,根据自己的数据集字典长度修改

可以分享一下这个子集吗?

SuperHHzy avatar Nov 21 '22 06:11 SuperHHzy

你好,我在用IM2LATEX-100K这个数据集进行训练的时候,我把字典换成了IM2LATEX-100K这个数据集对应的字典,为什么会报这个错误呢?你有出现这个错误吗? image

SuperHHzy avatar Nov 23 '22 09:11 SuperHHzy

你好,想请问你使用的IM2LATEX-100K的子集,是怎么生成PKL文件的呢?

SuperHHzy avatar Nov 29 '22 07:11 SuperHHzy

你好,我子集制作了一个IM2LATEX-100K的子集,训练集大约有10000张图片,验证集大概2000张图片,我只修改了config里面的字典长度,训练了220个epoch之后,ExpRate只有21%左右,不知道这是什么原因呢?不知可否告知一下你的数据集大小呢?

SuperHHzy avatar Dec 20 '22 12:12 SuperHHzy

您好,打扰了,我想使用印刷体数据集进行训练,但是当我把config中与数据集相关的配置文件转换成自己的以后,出现了图中所示的问题。请问您在训练运行的过程中出现了类似的问题吗?可以帮忙提一点建议吗? 屏幕截图_20221225_203552

ZCappuccino avatar Dec 25 '22 12:12 ZCappuccino

您好,打扰了,我想使用印刷体数据集进行训练,但是当我把config中与数据集相关的配置文件转换成自己的以后,出现了图中所示的问题。请问您在训练运行的过程中出现了类似的问题吗?可以帮忙提一点建议吗? 屏幕截图_20221225_203552

读图的时候读灰度图

Yuxiang1995 avatar Jan 13 '23 08:01 Yuxiang1995

你好,我想测试一下模型在印刷体公式识别上的效果,测试的ExpRate达到0.8,但是另外使用外来的图片预测的时候,结果总是一串相同的字符,这会是什么原因引起的呢?

输入图片: 00000495

程序结果: ![92959e6c1ddf7e6c0be4ba116882d78](https://user-images.githubusercontent.com/50820616/202946248-e668071a-ea14-4112-81f2-2d741c61b332.jpg

@yazheng0307 我拿数据集之外的图片来测效果也很差,似乎模型的泛化能力不好?请问你解决了吗

Yuxiang1995 avatar Jan 29 '23 02:01 Yuxiang1995

你好,我想测试一下模型在印刷体公式识别上的效果,测试的ExpRate达到0.8,但是另外使用外来的图片预测的时候,结果总是一串相同的字符,这会是什么原因引起的呢? 输入图片: 00000495 程序结果: ![92959e6c1ddf7e6c0be4ba116882d78](https://user-images.githubusercontent.com/50820616/202946248-e668071a-ea14-4112-81f2-2d741c61b332.jpg

@yazheng0307 我拿数据集之外的图片来测效果也很差,似乎模型的泛化能力不好?请问你解决了吗

你使用的是自己预训练的模型吗?请问模型的准确率如何呢?

SuperHHzy avatar Feb 02 '23 06:02 SuperHHzy

你好,我想测试一下模型在印刷体公式识别上的效果,测试的ExpRate达到0.8,但是另外使用外来的图片预测的时候,结果总是一串相同的字符,这会是什么原因引起的呢? 输入图片: 00000495 程序结果: ![92959e6c1ddf7e6c0be4ba116882d78](https://user-images.githubusercontent.com/50820616/202946248-e668071a-ea14-4112-81f2-2d741c61b332.jpg

@yazheng0307 我拿数据集之外的图片来测效果也很差,似乎模型的泛化能力不好?请问你解决了吗

一样遇到这个问题,请问有人解决了吗

limaopeng1 avatar Sep 18 '23 01:09 limaopeng1

我似乎也遇到这问题了,训练印刷体公式识别时,效果一直很差。

SWHL avatar Nov 06 '23 13:11 SWHL