请教一下，最近在研究练字本，想通过拍照识别文字书写是否工整并给出评分 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 1446 天前的主题，其中的信息可能已经有所发展或是发生改变。

有什么思路指点一下

20 条回复 • 2021-03-30 11:37:42 +08:00

1

Kinnice

2021-03-29 14:29:51 +08:00

1

根据 ocr 识别的速度来评分，写的越规整，（理论上)识别就越快（猜的）

2

crackhopper

2021-03-29 14:31:38 +08:00

乱说的哈
1. 偏旁部首拆分，和标准的偏旁部首的占比，等等进行对照。
2. 对偏旁部首本身的扭曲程度，手动标准打分，做模型进行训练。
3. 对多个字体大小和位置，作为评估指标。
4. 尝试拆解笔画，对笔画进行评估。
当然，最简单暴力的就是直接找出一堆手写样本，标定分数，训练模型。后续从上面的几个角度扩展，以及从模型的 bad case 里找思路。

3

crackhopper

2021-03-29 14:33:32 +08:00

数据预处理也是需要的，对齐，拉伸等等的。另外如果到笔画程度，可能需要用点几何特征。但我感觉针对特殊风格的手写体还是麻烦，比如行书。可以先限定楷体。

4

PeakFish

2021-03-29 14:34:21 +08:00

你测试测试颜真卿王羲之的能测试通过？机器能懂得人类的美吗

5

crackhopper

2021-03-29 14:35:51 +08:00

@PeakFish 做过才知道行不行。我觉得机器也是能理解美的。

6

yaphets666

2021-03-29 14:38:24 +08:00

@crackhopper 应该拿颜真卿王羲之的去训练就行了... 理解肯定是不能理解的

7

rayhy

2021-03-29 14:39:42 +08:00

直接检测每个字，然后看看每个字的 bounding box 足不足够对齐？

8

wxw752

2021-03-29 14:41:38 +08:00

工整这个概念很模糊，因为字体太多了。
我觉得可以做到判断写的字和训练集所用字体的相似程度。

9

crackhopper

2021-03-29 14:41:43 +08:00

@yaphets666 如果理解指的是合理打分，不一定，我觉得大概率能；如果理解指的是表达机器本身的情感，目前是不行。目前机器缺乏自我认知的建立的机制，我觉得是前馈网络本身的缺陷，但目前也就前馈网络容易训练和改进。

10

PeakFish

2021-03-29 14:43:14 +08:00

@rayhy 开玩笑，你看看字帖那字可是，有的大有的小

11

pkookp8

2021-03-29 14:44:29 +08:00 via Android

@PeakFish 正楷的训练集输入一个草书，必然 0 分呀
反过来，草书训练集输入一个正楷也一样

而且草书也有不同风格

12

PeakFish

2021-03-29 14:58:07 +08:00

@pkookp8 美是没有标准的

13

namelosw

2021-03-29 15:03:23 +08:00 via iPad

@PeakFish 美颜相机都能存在，书法为什么不行？很显然机器是可以很好地复现人的审美的。

14

ch2

2021-03-29 15:03:28 +08:00 via iPhone

工整的评分标准由谁来定？这个并不是代码的问题，但是是最重要的，这个没有人解决你就什么也办不到，也会是你产品的核心竞争力，但是很遗憾，它并不在你的代码上

15

flankechen

2021-03-29 16:38:03 +08:00

请先定义什么是工整，cost function，然后扔进网络学习就可以拉

16

cheneydog

2021-03-29 16:42:08 +08:00

“标准版” 和 “手写版” 二值化后异或，1 面积 /总面积为评分

17

raaaaaar

2021-03-29 17:14:46 +08:00 via Android

找 20 个人，手动打分（狗头

18

shuxiaokai

2021-03-29 17:14:49 +08:00

看你指定的标准是哪种字体了

19

kergee

2021-03-30 08:36:17 +08:00

用过象辞 AI 智能练字笔套装

20

q149072205

2021-03-30 11:37:42 +08:00

你这要有一个字体做为参照字体，不然你这识别就不标准了。。

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 5393 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 30ms · UTC 07:17 · PVG 15:17 · LAX 00:17 · JFK 03:17
Developed with CodeLauncher
♥ Do have faith in what you're doing.