RubanSeven

Results 5 comments of RubanSeven

我用python重写了这个代码,速度在14ms,有兴趣的可以支持下,https://github.com/RubanSeven/Text-Image-Augmentation-python

我用python重写了这个代码,速度在14ms,有兴趣的可以支持下,https://github.com/RubanSeven/Text-Image-Augmentation-python

我用python重写了这个代码,速度在14ms,有兴趣的可以支持下,https://github.com/RubanSeven/Text-Image-Augmentation-python

目前弱监督部分的效果还不好,生成的伪标签我还在调整,感觉达到作者的效果有点困难,有兴趣,可以一起探讨。 你可以先自行用SynthText80K训练一个强监督的模型,然后研究下伪标签的生成。

> 谢谢对我们工作的关注,读于您的问题,我理解如下,有不对的请批评指正: > > 1. GAN中判别器只是一个二分类器,其作用只是判断生成数据和真实数据是否同一个风格(可以理解为数据分布是否相似),而数据是生成器生成的,没有混淆背景的验证码生成时需要将背景参数设置为false。 > 2. Pre-processing model的作用是去除真实验证码中的背景和干扰线,或者是填充空心字符。其训练数据全部由生成数据组成,即有背景(干扰线)和无背景(干扰线)的生成验证码。 > 3. LeNet-5的训练也是使用生成的无背景(干扰线)的验证码,仅在模型迁移是使用了少量的去除背景(干扰线)的真实验证码数据。 > 4. 对于调整生成参数的步骤,我们主要思想是把参数枚举出来,然后选择生成最好的那一组参数,所以训练比较慢。这里还有待完善,在后续的实验中我们发现,把可变参数的初始值调大(例如把字符旋转角度调整为[-50,50],涵盖真实数据中的旋转角度),也可以不用调整生成参数。 请问参数是怎么训练出来的,论文中说是网格搜索,那怎么判断哪组参数最优呢,如果是判别器反向传播来获得的,那loss是怎么影响网格搜索的呢。