zcswdt

Results 99 comments of zcswdt

> 您好,我也遇到了同样的问题,请问您解决了吗? 我重新启动了一下训练,目前状态良好。

> unclip的ratio调大一点 感谢作者的回复,我也看了论文,找到了这个地方,不过还有一个问题要请教,就是我看到您在ic15数据集上训练了1200个epoch,在我们真实场景上,数据量可能比ic15大的多(列如5万张训练集),这个时候训练的epoch设置在多少比较好呢?

> convert type to unint8 region_image = region_image.astype(np.uint8) affinity_image = affinity_image.astype(np.uint8) 您好,我一直在关注您这个项目,关于此次的更新,在高斯热力图的生成上和上次是有什么区别吗?可以详细的介绍吗?

> finetune 老哥,请教您一个问题,请问您训练了么?

> _No description provided._ 可以区分,

> 请问下,项目中生成数据时该如何做数据类别平衡? 我没有把做类别的具体可调参数写到参数解析里面,具体的参数写在每个功能模块中,如果你想修改类别比例,可以定位到该模块,去模块中修改一下参数就行。比如你想生成横排和竖排,你可以选择在这个地方选择修改你生成的比例。https://github.com/zcswdt/Color_OCR_image_generator/blob/e9c62c1a8f887fe4342c6c2c3ce5ab2f8b545f00/OCR_image_generator.py#L722 如果你想生成带有高斯模糊的图片,你可以到https://github.com/zcswdt/Color_OCR_image_generator/blob/e9c62c1a8f887fe4342c6c2c3ce5ab2f8b545f00/OCR_image_generator.py#L569中修改参数。

> 我指的是字的类别比例,比如一共5990类,语料中每个字的出现的频率是不一样的,直接随机生成应该会生成更多的高频率的字吧 1. 你说的这个按照频率的生成方法,不会涉及到语料的选取,是直接从这个字典5990中按照字符在特定场景下出现的频率随机选择拼凑到图片上,与此同时这样也就失去了语义信息。 2. 我这个是选择语料来生成图片,因为语料是文章,小说或者是新闻,它本身已经包含了频率信息,常见的字符出现的频率肯定是最高的。然后在随机截取文字长度,生成到图片上,这样也很好的保留了语义信息。

> 你好,能否提供新的ICDAR2017-MLT下载链接,谢谢 https://rrc.cvc.uab.es/?ch=8&com=downloads

> @zcswdt 官网最近无法下载,且发邮件也到不了他们信箱上,是否能给我重新分享一下百度云链接呢?谢谢 链接:https://pan.baidu.com/s/112llrK1k_CS8NzvaFyXNvQ 提取码:3kop

> @Real-YeJ 所有文件均已上傳 > https://drive.google.com/drive/folders/1dBa0ljHa4BSFKfT8LYjK1crSAl9rbHSZ?usp=sharing good job