kingqiuol
kingqiuol
> 训练了29个epoch 最优的模型验证准确率一直是0 是我训练的轮次太少了吗 transformer一般前十个轮次就很高了,29epoch还为0就要检查下了,标签是不是对,或者模型是否加载对,最后是这个CoMER推理模型就是个坑需要自己改一下
> 该算法是基于图像的公式识别,我就想它是否可以基于图片进行文本识别。 > > 使用了单行的的文本数据3w+,也替换了dictionary.txt(仅包括样本中出现的字符),但是准确率一直为0,这是哪里有问题吗? 可以肯定,优于现有文本行识别方法,如CRNN,至于结果,我觉得还是检测标签格式啥的,其次是推理过程模型加载以及解码过程都需要注意
多卡的话,就DDP,半精度在数据量足够多用(10w以上吧),不然会不收敛
> bash eval_all.sh的时候,是否遇到这样的报错呢?我确认我是导入了comer了的  自己添加下环境就行吧 import sys sys.path.append(xxxxxx) # 当前CoMER文件夹路径
我看的bttr中只用到plain_l2r, plain_r2l, bline 这三个, sline_l2r, sline_r2l, mline_l2r, mline_r2l,这三种数据格式会用得到嘛
> @ProfFan I'm glad this model is useful to you. Snap2LaTex is indeed impressive, and thank you for your efforts in making such a cool tool. While I'm not quite...