比如截图后 能识别图片中的所有文字 (当然文字都是规范的) 能识别到文字所在图片相对位置.
有什么开源的代码么? C/C++/python 都可
1
kenshinji 2016-10-09 18:11:14 +08:00 via iPhone
Pyteract?
|
2
slysly759 2016-10-09 19:00:44 +08:00 via Android
@kenshinji 好像拼错了吧⊙▽⊙
@题主 以前用汉皇还是一些 OCR 工具感觉除了拍照中书的字可以识别,其他手写啊倒着啊都不行 你这个需求有点小困难啊,先不说草书 行书 单是什么瘦金体 旋转 你就需要训练模型| ू•ૅω•́)ᵎᵎᵎ 现在流行的也不过识别验证码 或者图片归类什么的 你看百度这么大公司那个图片搜索做的啥德行你就明白了(⁄ ⁄•⁄ω⁄•⁄ ⁄) |
3
reus 2016-10-09 19:26:46 +08:00
百度的 ocr 还可以,就是贵。这个东西如果做得好,赚钱很容易,不会轻易开源的
|
4
rogerchen 2016-10-09 22:49:54 +08:00
深度学习 again
|
5
sutra 2016-10-09 23:39:18 +08:00
tesseract
|
6
sigroma 2016-10-10 00:08:47 +08:00
你说的截图是指随便拍照,还是电脑上的截图
如果是第一种,这在 CV 上叫自然场景文字检测与识别( scene text localization and recognition ),是个挺难的问题,有个国际比赛 ICDAR 专注这方面问题,你可以看看这个比赛的历史论文,找作者要要源码 google 翻译里就有这个功能 如果是电脑截图,也可以利用这个方面的一些成果 文字定位可以使用 SWT 算法,这个算法实现简单,效果还不错, github 上能找到很多源代码 我比较推荐 ccv 这个库带的 http://libccv.org/doc/doc-swt/ 文字的识别目前基本上就楼上提到的 tesseract 是能用的,如果你只限英文的话倒是还有些开源项目可选 |
7
likuku 2016-10-10 11:21:04 +08:00
隔壁也有个类似话题:
https://www.v2ex.com/t/311454 |
8
gamecreating OP @sutra 现在用的这个 识别速度很慢.. 而且需要训练后 才识别率高..
|