Text_select_captcha icon indicating copy to clipboard operation
Text_select_captcha copied to clipboard

模型训练完了,给大家一个参考

Open ghost opened this issue 1 year ago • 3 comments

我的项目运行时需要识别验证码,建了两个文件夹,用于存放失败验证码和成功验证码,这两个文件夹图片数量的比可以很好的反映模型的强度

yolo模型:5365张成功验证码做训练集,25张失败验证码手动标注做验证集,训练156代,识别成功率无限接近百分百,配合仓库里的prev6孪生模型,正确 : 错误大概为1000:200,且错误验证码都是点击顺序错误,不存在漏识别的情况

孪生模型:1000组汉字和图标做训练集,程序从训练集中抽取十分之一做验证集,第48代就可以秒杀prev6模型了,能够正确识别原模型的所有错误验证码,配合自己训练的yolo模型,正确 : 错误为n:0

ghost avatar Nov 04 '24 03:11 ghost

我的项目运行时需要识别验证码,建了两个文件夹,用于存放失败验证码和成功验证码,这两个文件夹图片数量的比可以很好的反映模型的强度

yolo模型:5365张成功验证码做训练集,25张失败验证码手动标注做验证集,训练156代,识别成功率无限接近百分百,配合仓库里的prev6孪生模型,正确 : 错误大概为1000:200,且错误验证码都是点击顺序错误,不存在漏识别的情况

孪生模型:1000组汉字和图标做训练集,程序从训练集中抽取十分之一做验证集,第48代就可以秒杀prev6模型了,能够正确识别原模型的所有错误验证码,配合自己训练的yolo模型,正确 : 错误为n:0

更新,之前训练的孪生模型有大问题,调整了一下样本生成代码,对char和target进行旋转,并且用了更多样本,从0开始训练,不使用预权重模型。在第15代错误率达到10%

ghost avatar Nov 06 '24 09:11 ghost

咋训练的,我准备自己训练,不知道如何准备dataset

maryjeck avatar Sep 28 '25 03:09 maryjeck

咋训练的,我准备自己训练,不知道如何准备dataset

大佬解决了吗

lemontree888 avatar Dec 17 '25 06:12 lemontree888