V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
MrZok
V2EX  ›  程序员

[福利] 自动识别验证码,本地 API,无须搭环境,一键开启! 12306、sougou、腾讯、微博 等验证码识别

  •  1
     
  •   MrZok · 2020-01-02 12:10:13 +08:00 · 5982 次点击
    这是一个创建于 1816 天前的主题,其中的信息可能已经有所发展或是发生改变。

    此项目以研究学习、减轻测试量为目的,禁止用于非法用途

    工具主要功能包含: 各类调试转码、免费代理 IP 获取、验证码自动识别、免费短信接收器、等功能。

    误杀:360 等杀毒软件会对工具误杀,添加信任即可。

    作者:Zok

    GitHub: https://github.com/wkunzhi

    声明(毕竟是侵权的东西)限制如下:

    1. 仅支持简单验证码识别;
    2. 识别线程最大每秒 10 次;
    3. 不会提供完整的识别方案;

    感谢数据集提供:

    12306 数据集 https://bbs.nightteam.cn/thread-84.htm

    sougou 数据集 https://bbs.nightteam.cn/thread-149.htm

    本地 API 调用示例 python:

    import requests 
    import base64   
    
    # 1. 先二进制读图片 
    with open('code.png', 'rb') as f:     
    	img = f.read()
        
    # 2. 图片 base64 编码一下 
    # 3. 组装 data 发送 post 请求!端口号是软件上绑定的端口号,默认 8820 
    ret= requests.post('http://127.0.0.1:8820', data={"img": base64.b64encode(img)})   
    
    # 4. 收到返回结果 
    print(ret.text)
    

    普通验证码测试:

    验证码 识别结果

    12306 图片识别

    验证码 识别结果

    此项目以研究学习、减轻测试量为目的,禁止用于非法用途。

    声明(毕竟是侵权的东西)限制如下:

    1. 仅支持简单验证码识别;
    2. 识别线程最大每秒 10 次;
    3. 不会提供完整的识别方案;

    第 1 条附言  ·  2020-01-07 10:15:02 +08:00

    这是对指定验证码进行训练与识别,所以准确率在 99% 是比较高的。

    附:

    • 如果想要识别特定的验证码可以联系群主,群主有空会慢慢添加的。
    • 有什么好的提议也可以告诉群主
    21 条回复    2020-01-07 10:15:32 +08:00
    wysnylc
        1
    wysnylc  
       2020-01-02 12:30:08 +08:00
    如果识别率有 90%以上那确实厉害了
    Tink
        2
    Tink  
       2020-01-02 12:37:18 +08:00 via iPhone
    sadfQED2
        3
    sadfQED2  
       2020-01-02 12:38:13 +08:00
    这么快就 404 了?? ai 网络结构啥样的,原创还是其他开源的
    MrZok
        4
    MrZok  
    OP
       2020-01-02 12:46:39 +08:00
    目前支持的验证码,识别率 97% 左右吧
    MrZok
        5
    MrZok  
    OP
       2020-01-02 12:48:02 +08:00
    @sadfQED2 原创
    MrZok
        6
    MrZok  
    OP
       2020-01-02 12:48:13 +08:00
    @wysnylc 目前支持的验证码,识别率 97% 左右
    sadfQED2
        7
    sadfQED2  
       2020-01-02 12:49:44 +08:00 via Android
    @MrZok 基于 tf 的?开源模型吗,你的 github 已经被封了吧,打开 404 了
    MrZok
        8
    MrZok  
    OP
       2020-01-02 12:53:13 +08:00
    @sadfQED2 没有被封,我有没反* 又没搞颜色。
    sadfQED2
        9
    sadfQED2  
       2020-01-02 12:53:21 +08:00
    额,没被封,但是看了半天,就一个 Readme,下载都是二进制文件,这也能叫开源吗
    MrZok
        10
    MrZok  
    OP
       2020-01-02 12:54:22 +08:00
    @sadfQED2 我什么时候说的开源,我是写好的软件,直接一键运行就开源识别验证码了。
    chenqh
        11
    chenqh  
       2020-01-02 13:14:20 +08:00
    什么时候才能像大佬们一样优秀呀
    ZredoC
        12
    ZredoC  
       2020-01-02 13:19:49 +08:00
    什么时候才能像大佬们一样优秀呀
    lsylsy2
        13
    lsylsy2  
       2020-01-02 13:25:42 +08:00
    不开源,会被“误杀”,额……
    Ritter
        14
    Ritter  
       2020-01-02 14:12:09 +08:00
    什么时候才能像大佬们一样优秀呀
    crab
        15
    crab  
       2020-01-02 15:14:44 +08:00
    微博有免验证码接口,腾讯现在都是滑动了吧。
    locoz
        16
    locoz  
       2020-01-02 15:33:54 +08:00
    你 V2 的这个号,头像好骚啊
    loryyang
        17
    loryyang  
       2020-01-02 15:41:08 +08:00
    图片识别这个新增类型就没法识别了吧?
    数字+字母的验证码,大家可以看 densenet 的 cnn,基本上主流的数字+字母的验证码都可以攻破的。如果定长的数字+字母,难度没那么高,可能不需要用这么复杂的结构
    MrZok
        18
    MrZok  
    OP
       2020-01-02 16:05:58 +08:00
    @loryyang 其他类型的需要训练才行,我这个目前只支持这几种,后面有空会继续添加类型的,或者你们提供数据集我来训练。
    MrZok
        19
    MrZok  
    OP
       2020-01-02 16:06:29 +08:00
    @locoz 这都被你发现了,这是小陌的照片,我有全套
    locoz
        20
    locoz  
       2020-01-02 16:25:10 +08:00
    @MrZok #19 不用了不用了,身体吃不消
    MrZok
        21
    MrZok  
    OP
       2020-01-07 10:15:32 +08:00
    这是对指定验证码进行训练与识别,所以准确率在 99% 是比较高的。

    附:
    如果想要识别特定的验证码可以联系群主,群主有空会慢慢添加的。
    有什么好的提议也可以告诉群主
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1022 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 23:10 · PVG 07:10 · LAX 15:10 · JFK 18:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.