OCR 怎么提高准确率？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

Casibase - 开源AI知识库

Casibase是一套开源的基于LangChain的AI知识库，支持国内外数十种主流AI模型，支持MCP协议，所有会话数据云端存储，支持Office文件存储与向量索引，支持思维链和提示词调优模块，支持多命名空间与企业SSO单点登录。

开源代码

Promoted by veotax

PRO

这是一个创建于 360 天前的主题，其中的信息可能已经有所发展或是发生改变。

最近有一大批图片需要识别，都是一个样式的，算是很标准的图片。
上面 16 个字符（数字大写字母）
下面 6 个数字
暂时就是用 umi-ocr 工具
发现默认的英文中文，识别出来都有些问题。1000 多张会有 10 个左右有问题。
识别出来上面不是 16 个字符。
求解怎么弄好点。

OCR

准确率

识别

15 条回复 • 2024-08-05 09:57:54 +08:00

busier

360 天前 via iPhone

你都确定是一个样式了先将图片除了那 16 个字符外面，多余的部分裁剪掉啊

Daybyedream

360 天前

@busier 处理的是已经裁剪过了的只有两列东西。就是有些 F 识别成 9 ，有些 YL 之类的识别错。

trungdieu031

360 天前

标注或合成一部分数据，自己训练/微调一个模型

akira

360 天前

试试传统 ocr + 大语言模型的方案，例如 llama index 这些

tool2dx

360 天前

提不了，类似 GPT 回答 100%正确率一样，不太可能。

可以多个模型交叉验证，或者做一次识别后文字的 rasterization ，对比图片前后相似度。

miaomiao888

360 天前

想要高精度就别用离线了，试试合合 OCR ，业界精度最高。

weiwoxinyou

360 天前

如果是标准的数字和字母，不需要什么高级算法，纯按传统的图片识别方式就行，python 直接调 opencv 的 api 就行

uTOmOuk3L6sb4MSI

360 天前 via iPhone

@weiwoxinyou 我问了 ChatGPT 说 opencv 本身没有用于字符识别的 api

paopjian

360 天前

固定角度固定文本大小,直接用图形匹配?或者弄两个模型交叉验证?

Les1ie

360 天前

paddleocr 效果很棒，资源占用少，离线部署简单

Daybyedream

360 天前

@weiwoxinyou 大概懂了，直接一个个字符截出来然后识别？这样？反正就那么几个

Daybyedream

360 天前

@trungdieu031 我去研究下

seeu2ex

360 天前 via iPhone

如果是线条加数字英文的话可以试试调对比度等，直接给去除无用线条，在加深可用部分的颜色深度

SWALLOWW

359 天前

微信有没有接口

yaleyu

359 天前

图片剪裁一下，然后二值化一下，paddleocr, easyocr, rapidocr 都识别一次，再对比一下识别结果，应该不会出错。