现在有什么开源项目能识别图片中的文字的么?

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 2954 天前的主题，其中的信息可能已经有所发展或是发生改变。

比如截图后能识别图片中的所有文字 (当然文字都是规范的) 能识别到文字所在图片相对位置.

有什么开源的代码么? C/C++/python 都可

文字

识别

开源

图片

8 条回复 • 2016-10-11 09:54:02 +08:00

kenshinji

2016-10-09 18:11:14 +08:00 via iPhone

Pyteract?

slysly759

2016-10-09 19:00:44 +08:00 via Android

@kenshinji 好像拼错了吧⊙▽⊙
@题主以前用汉皇还是一些 OCR 工具感觉除了拍照中书的字可以识别，其他手写啊倒着啊都不行
你这个需求有点小困难啊，先不说草书行书单是什么瘦金体旋转你就需要训练模型| ू•ૅω•́)ᵎᵎᵎ
现在流行的也不过识别验证码或者图片归类什么的
你看百度这么大公司那个图片搜索做的啥德行你就明白了(⁄ ⁄•⁄ω⁄•⁄ ⁄)

reus

2016-10-09 19:26:46 +08:00

百度的 ocr 还可以，就是贵。这个东西如果做得好，赚钱很容易，不会轻易开源的

rogerchen

2016-10-09 22:49:54 +08:00

深度学习 again

sutra

2016-10-09 23:39:18 +08:00

tesseract

sigroma

2016-10-10 00:08:47 +08:00

你说的截图是指随便拍照，还是电脑上的截图

如果是第一种，这在 CV 上叫自然场景文字检测与识别（ scene text localization and recognition ），是个挺难的问题，有个国际比赛 ICDAR 专注这方面问题，你可以看看这个比赛的历史论文，找作者要要源码
google 翻译里就有这个功能

如果是电脑截图，也可以利用这个方面的一些成果
文字定位可以使用 SWT 算法，这个算法实现简单，效果还不错， github 上能找到很多源代码
我比较推荐 ccv 这个库带的
http://libccv.org/doc/doc-swt/
文字的识别目前基本上就楼上提到的 tesseract 是能用的，如果你只限英文的话倒是还有些开源项目可选

likuku

2016-10-10 11:21:04 +08:00

隔壁也有个类似话题：
https://www.v2ex.com/t/311454

gamecreating

2016-10-11 09:54:02 +08:00

@sutra 现在用的这个识别速度很慢.. 而且需要训练后才识别率高..

现在有什么开源项目 能识别图片中的文字的么?

现在有什么开源项目能识别图片中的文字的么?