V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
rv54ntjwfm3ug8
V2EX  ›  C++

有没有小型的数字 / 英文 OCR 模块可以集成进 C++写的小工具里面?

  •  
  •   rv54ntjwfm3ug8 · 2022-03-01 17:45:13 +08:00 · 1451 次点击
    这是一个创建于 1002 天前的主题,其中的信息可能已经有所发展或是发生改变。

    数字 / 英文的字体 / 大小都是固定的,不包含中文或任何符号,都是软件生成的图片,没有任何扭曲 / 倾斜,识别起来难度应该不大吧。体积越小越好,最好 <2MB 。请问有没有这样的开源模块?

    第 1 条附言  ·  2022-03-01 18:32:22 +08:00
    是性能很烂,硬盘很小还没有联网的工控机。或者有什么更好的方案么?
    6 条回复    2022-03-01 23:25:37 +08:00
    janus77
        1
    janus77  
       2022-03-01 17:49:28 +08:00
    用在线 api 吧
    rv54ntjwfm3ug8
        2
    rv54ntjwfm3ug8  
    OP
       2022-03-01 18:32:52 +08:00
    @janus77 #1 工控机,没有联网
    3dwelcome
        3
    3dwelcome  
       2022-03-01 18:39:39 +08:00
    好像网上的 AI 入门第一课,就是写你这个英文和数字识别。

    实在不行自己写一个呗。
    ysc3839
        4
    ysc3839  
       2022-03-01 18:43:32 +08:00 via Android
    看看 Tesseract?也许自己裁剪一下能减小大小
    thedrwu
        5
    thedrwu  
       2022-03-01 19:00:03 +08:00 via Android
    08/09 年刚有 github 的时候花了一周时间写了个简陋但是快速的 ocr ,投影分割+归一化边界距离向量。不熟悉 github 的玩法,常常收到 fork/pr 嫌麻烦,于是删库了,再后来本地源码也丢失了
    Hconk
        6
    Hconk  
       2022-03-01 23:25:37 +08:00 via iPhone
    做过类似场景下在工控机上用 opencv 的 knn 识别,不过只有数字没有字母,时间快效果还挺好。先用相同字体分割出来的图训练出来 label ,用的时候加载提前训练好的 label ,把分割的字符用 knn 分类就行了。不过感觉如果包含字母效果就不一定了,像 O 和 0 就不好区分。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1036 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 20:11 · PVG 04:11 · LAX 12:11 · JFK 15:11
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.