V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
autoname
V2EX  ›  Java

各位老哥有什么验证码识别的第三方接口

  •  
  •   autoname · 2020-07-07 07:27:46 +08:00 · 5611 次点击
    这是一个创建于 1361 天前的主题,其中的信息可能已经有所发展或是发生改变。

    看到腾讯一个月 1000 次, 百度是 50000/天

    还有其他的吗 可以用来爬 dz 论坛吗

    38 条回复    2021-02-21 19:57:41 +08:00
    supermoonie
        1
    supermoonie  
       2020-07-07 08:59:54 +08:00 via iPhone
    讯飞,网易,做云的,都有吧
    supermoonie
        2
    supermoonie  
       2020-07-07 09:00:54 +08:00 via iPhone
    @supermoonie 哦....验证码识别,我说的是 OCR 🤣
    lihongming
        3
    lihongming  
       2020-07-07 09:05:36 +08:00 via iPhone
    百度那个准确度还可以,不过看起来你要想免费的……要是找到的话也给大家分享一下吧。
    bzj
        4
    bzj  
       2020-07-07 09:31:48 +08:00
    github 上找开源库自己搭一个
    autoname
        5
    autoname  
    OP
       2020-07-07 09:33:01 +08:00
    @bzj 这也行,厉害。大佬有没有推荐的仓库
    locoz
        6
    locoz  
       2020-07-07 11:23:43 +08:00
    你要说具体是什么样的验证码别人才好给你推荐...
    autoname
        7
    autoname  
    OP
       2020-07-07 12:44:43 +08:00
    @locoz 大佬又看到你了,哈

    就是 discuz 那种 4 文字 或数字的
    yujiang
        8
    yujiang  
       2020-07-07 12:45:52 +08:00 via Android
    啥验证码?图片,滑动,还是 hcaptcha 这样的
    autoname
        9
    autoname  
    OP
       2020-07-07 12:51:28 +08:00
    flowercoder
        10
    flowercoder  
       2020-07-07 12:55:40 +08:00
    其实用本地的效果也不错,不一定非要调 api,这东西不就是限制非人类嘛,其实可以从限制接口访问次数等其他方面去做限制
    locoz
        11
    locoz  
       2020-07-07 12:55:57 +08:00 via Android
    @autoname #7 这种简单,晚点我发个别人弄的本地打码服务给你,直接用就行。午休先😴
    autoname
        12
    autoname  
    OP
       2020-07-07 13:04:33 +08:00
    @locoz 好滴,感谢大佬
    autoname
        13
    autoname  
    OP
       2020-07-07 13:07:37 +08:00
    @flowercoder 我就菜鸡一个,连百度都搜不到 相关的教程资料,很少,要么不能用,要么都是安卓的,谷歌又答非所问,搜的结果和我预期的相差很多,很少用谷歌
    SingeeKing
        14
    SingeeKing  
       2020-07-07 13:11:20 +08:00   ❤️ 1
    autoname
        15
    autoname  
    OP
       2020-07-07 13:17:39 +08:00
    @SingeeKing 收到,谢谢大佬。我研究研究
    flowercoder
        16
    flowercoder  
       2020-07-07 13:20:39 +08:00
    @autoname 我看错了,你是要爬对吧,我刚试过 muggle_ocr,很不错,完全满足我的要求,还能调用我的 gpu,强烈推一下。昨天找的时候还试了下 ttshitu 这家收费的,测试了下也都对,一条 0.2 厘吧,感觉也能试试。tesseract 我也试了,我那种他跑不了。
    autoname
        17
    autoname  
    OP
       2020-07-07 13:49:29 +08:00
    @flowercoder 对呀 爬帖子,有些帖子 隐藏回复 才能看到的, 所以。。。
    chenuu
        18
    chenuu  
       2020-07-07 13:57:56 +08:00 via Android
    超级鹰
    autoname
        19
    autoname  
    OP
       2020-07-07 14:43:35 +08:00
    @chenuu 玩不起,
    locoz
        20
    locoz  
       2020-07-07 15:43:36 +08:00
    @autoname 冷月的文字通用验证码识别服务,可以本地部署
    https://bbs.nightteam.cn/thread-578.htm
    autoname
        21
    autoname  
    OP
       2020-07-07 15:52:45 +08:00
    @locoz 耦豁。只支持 win,阿勒,
    img 参数为图片的 bytes 这是说要 base64 转码赋给 img 吗
    locoz
        22
    locoz  
       2020-07-07 16:00:22 +08:00
    @autoname #21 不需要,bytes 类型,和 base64 编码没关系。你就按 demo 里的那样直接把请求到的 content 传进去就行。
    autoname
        23
    autoname  
    OP
       2020-07-07 18:12:15 +08:00
    @locoz 嗯,有点不会用,有没有像接口那样,传个图片地址进去,直接返回结果的呢
    locoz
        24
    locoz  
       2020-07-07 18:14:28 +08:00
    @autoname #23 emmmm,没有...你就按 demo 代码里面那样请求一下图片地址,然后把图片的二进制再扔给那个识别接口就好了。
    autoname
        25
    autoname  
    OP
       2020-07-07 18:24:00 +08:00
    autoname
        26
    autoname  
    OP
       2020-07-07 18:29:47 +08:00
    @locoz
    img_resp = requests.get(img_url)
    print(get_code(img_resp.content))

    好像就传个图片地址,没什么其他操作
    locoz
        27
    locoz  
       2020-07-07 18:48:47 +08:00
    @autoname #25 看了一下 okhttp3 的文档

    你先请求那个验证码图片的地址,然后调用 Response.body().bytes()获取到图片的二进制。
    接着,用 new Request.Builder().url("http://127.0.0.1:7788/").post(img).build();去请求识别接口。
    autoname
        28
    autoname  
    OP
       2020-07-07 18:55:24 +08:00
    @locoz 好的,谢谢大佬详细回答,刚好有个吃灰的小鸡可以挂,非常感谢
    koala9527
        29
    koala9527  
       2020-07-07 19:31:58 +08:00
    文字数字可以做字库解决的。看我的 https://zhuanlan.zhihu.com/p/146051002
    autoname
        30
    autoname  
    OP
       2020-07-07 19:35:13 +08:00
    @koala9527 额!又是 Python 能做出一个网站 生成一个接口吗,我用再 spring boot 上的
    autoname
        31
    autoname  
    OP
       2020-07-07 20:02:26 +08:00
    @locoz 大佬 弱弱的问下 jsoup 是这样 请求图片吗
    我怎么。。

    https://cdn.jsdelivr.net/gh/post-get/static/b25b023d9d184243a30867c02d952edf.png
    locoz
        32
    locoz  
       2020-07-07 21:27:47 +08:00
    @autoname #31 不清楚,感觉是你 data 那里的问题,有点像是给处理成 string 了,应该是 bytes 的
    autoname
        33
    autoname  
    OP
       2020-07-07 21:33:42 +08:00
    @locoz 嗯,不知道下标 是什么,没个文档 蛋疼
    shc
        34
    shc  
       2020-07-07 23:22:56 +08:00
    我都用的斐斐
    http://www.fateadm.com/
    xuanbg
        35
    xuanbg  
       2020-07-08 08:22:38 +08:00
    1 、自己搞个开源库来写代码解决
    2 、淘宝打码
    3 、两者结合

    爬虫写得好,牢饭吃到饱。楼主千万要三思而后行啊
    autoname
        36
    autoname  
    OP
       2020-07-08 11:12:45 +08:00
    @xuanbg 看你说的,互联网不都是抄来抄去吗, 没见过谁 因为爬帖子,转载吃 xx 的。
    csavvv
        37
    csavvv  
       2021-01-09 12:00:11 +08:00
    autoname
        38
    autoname  
    OP
       2021-02-21 19:57:41 +08:00
    @csavvv 游客 2 次每小时,已注册用户 5 次每小时。。。
    不好玩。又没有接口来对接
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2832 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 14:53 · PVG 22:53 · LAX 07:53 · JFK 10:53
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.