搜了搜似乎谷歌的 tesseract 不错,但是感觉好像不是最新项目,感觉 cv 这些年进步应该也挺多的。有什么好用的开源或者免费项目吗?
想给自己做日文漫画翻译写个划词小工具
1
mineralsalt 2022-01-19 22:20:20 +08:00
Bob
|
2
omtow 2022-01-19 22:33:46 +08:00 via iPhone
paddleocr
|
3
ClericPy 2022-01-20 00:10:33 +08:00
|
4
ynyounuo 2022-01-20 00:28:50 +08:00
日语漫画 OCR 我在用的一个 app KantanManga 里用的还是 tesseract 感觉还行吧,项目老但是有活跃维护就没啥问题吧
要更准确还是得用大公司的 API ,GCP Vision 和 AWS Textract 之类的 |
5
caryRowen 2022-01-20 00:49:05 +08:00 via Android
Paddle ocr 挺好的 正琢磨着编译个来用
|
6
retrocode 2022-01-20 06:01:36 +08:00
个人用的话 我是建议直接用阿里云或者腾讯百度云的文字识别服务,免费额度没有 1000 次基本都用了, 不要指望 tesseract 这种开源识别库, 识别率感人尤其你还是识别漫画文字, 最后还得自己训练模型.
我之前折腾过,当时单纯就是用来识别数字和时间, 模型训练的我吐了, 最后识别率也只有 80%左右,每条识别完后都得手动校准下确认结果,太痛苦了. |
7
jifengg 2022-01-20 08:49:10 +08:00
|
8
Tomorrowxxy 2022-01-20 09:06:31 +08:00 via iPhone
@jifengg 求分享
|
9
anzu 2022-01-20 10:17:57 +08:00
按照现有技术漫画汉化基本可以做到自动化,场景文字检测、自动翻译、自动嵌字,最后人工校对一下。我记得好像有类似的工具。
|
10
lizytalk 2022-01-20 13:16:46 +08:00 via iPhone
ddddocr
|
11
LeeReamond OP @omtow 似乎是个国产的项目,试了一下在电脑上调用 ocr 直接闪退,且无任何错误提示,我的电脑是 win 平台,只能说令人咋舌
|
12
sml2h3 2022-01-20 17:12:09 +08:00
|
13
chunchu 2022-01-20 22:51:45 +08:00 via iPhone
OCR.space
|