V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
pdfgo
V2EX  ›  问与答

请教一下这种验证码该怎么识别?

  •  1
     
  •   pdfgo · 2019-06-26 00:03:56 +08:00 · 2360 次点击
    这是一个创建于 1979 天前的主题,其中的信息可能已经有所发展或是发生改变。

    各位大佬,大家好!

    验证码示例

    验证码特征

    1. 字符非常规范
    2. 添加了随机粗的干扰线

    已知信息

    1. 如果去掉干扰线,这种验证码是非常好识别的
    2. 如果不去掉干扰线,这种验证码简直就是灾难
    3. 但是这个干扰线和字符粗细大小非常相似,并且目前没有找到干扰线的明显特征
      • 不是直线
      • 粗细不一致
      • 位置不确定
      • 和字符粗细,颜色相仿,且相互覆盖

    我想请教的

    1. 请问大佬们能找到这个干扰线的特征吗?或者说如何把这个干扰线去掉?
    2. 能否推荐一些相关的学习资料供我参考?
    7 条回复    2019-07-03 10:10:34 +08:00
    rogwan
        1
    rogwan  
       2019-06-26 00:49:03 +08:00 via Android
    有一些机器学习的去干扰库,github 上有不少,90%以上的识别
    wafm
        2
    wafm  
       2019-06-26 00:53:33 +08:00
    这个还是挺好分析的这种验证码在市场上接单的价格不会很贵

    二值化,去干扰,分割,按特征识别

    我估计一些 OCR 库都可以大概率的识别出来。。。
    wafm
        3
    wafm  
       2019-06-26 00:58:39 +08:00
    你这个干扰线很连续,且只有一条

    你 google 八皇后算法 应该是可以解决掉的

    算出像素点后自己处理掉 再分割
    Takamine
        4
    Takamine  
       2019-06-26 10:07:01 +08:00 via Android
    图像识别。( X )
    打码平台。(√)
    byteio
        5
    byteio  
       2019-06-26 15:38:48 +08:00
    CNN、RNN、一堆识别算法( X )
    充值 10 元、打码平台 (√)
    moodasmood
        6
    moodasmood  
       2019-06-26 15:55:28 +08:00
    CNN、RNN、一堆识别算法( X )
    充值 10 元、打码平台 (√)
    nnnToTnnn
        7
    nnnToTnnn  
       2019-07-03 10:10:34 +08:00
    机器学习,ORC ( X )
    充值 10 元、打码平台 (√)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5432 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 09:34 · PVG 17:34 · LAX 01:34 · JFK 04:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.