Text_select_captcha 模型训练完了，给大家一个参考

我的项目运行时需要识别验证码，建了两个文件夹，用于存放失败验证码和成功验证码，这两个文件夹图片数量的比可以很好的反映模型的强度

yolo模型：5365张成功验证码做训练集，25张失败验证码手动标注做验证集，训练156代，识别成功率无限接近百分百，配合仓库里的prev6孪生模型，正确 : 错误大概为1000:200，且错误验证码都是点击顺序错误，不存在漏识别的情况

孪生模型：1000组汉字和图标做训练集，程序从训练集中抽取十分之一做验证集，第48代就可以秒杀prev6模型了，能够正确识别原模型的所有错误验证码，配合自己训练的yolo模型，正确 : 错误为n:0

Nov 04 '24 03:11 ghost

我的项目运行时需要识别验证码，建了两个文件夹，用于存放失败验证码和成功验证码，这两个文件夹图片数量的比可以很好的反映模型的强度

yolo模型：5365张成功验证码做训练集，25张失败验证码手动标注做验证集，训练156代，识别成功率无限接近百分百，配合仓库里的prev6孪生模型，正确 : 错误大概为1000:200，且错误验证码都是点击顺序错误，不存在漏识别的情况

孪生模型：1000组汉字和图标做训练集，程序从训练集中抽取十分之一做验证集，第48代就可以秒杀prev6模型了，能够正确识别原模型的所有错误验证码，配合自己训练的yolo模型，正确 : 错误为n:0

更新，之前训练的孪生模型有大问题，调整了一下样本生成代码，对char和target进行旋转，并且用了更多样本，从0开始训练，不使用预权重模型。在第15代错误率达到10%

Nov 06 '24 09:11 ghost

咋训练的，我准备自己训练，不知道如何准备dataset

Sep 28 '25 03:09 maryjeck

咋训练的，我准备自己训练，不知道如何准备dataset

大佬解决了吗

Dec 17 '25 06:12 lemontree888