1
Kinnice 2021-03-29 14:29:51 +08:00 1
根据 ocr 识别的速度来评分,写的越规整,(理论上)识别就越快(猜的)
|
2
crackhopper 2021-03-29 14:31:38 +08:00
乱说的哈
1. 偏旁部首拆分,和标准的偏旁部首的占比,等等进行对照。 2. 对偏旁部首本身的扭曲程度,手动标准打分,做模型进行训练。 3. 对多个字体大小和位置,作为评估指标。 4. 尝试拆解笔画,对笔画进行评估。 当然,最简单暴力的就是直接找出一堆手写样本,标定分数,训练模型。后续从上面的几个角度扩展,以及从模型的 bad case 里找思路。 |
3
crackhopper 2021-03-29 14:33:32 +08:00
数据预处理也是需要的,对齐,拉伸等等的。另外如果到笔画程度,可能需要用点几何特征。但我感觉针对特殊风格的手写体还是麻烦,比如行书。可以先限定楷体。
|
4
PeakFish 2021-03-29 14:34:21 +08:00
你测试测试 颜真卿 王羲之的 能测试通过? 机器能懂得人类的美吗
|
5
crackhopper 2021-03-29 14:35:51 +08:00
@PeakFish 做过才知道行不行。我觉得机器也是能理解美的。
|
6
yaphets666 2021-03-29 14:38:24 +08:00
@crackhopper 应该拿颜真卿 王羲之的去训练就行了... 理解肯定是不能理解的
|
7
rayhy 2021-03-29 14:39:42 +08:00
直接检测每个字,然后看看每个字的 bounding box 足不足够对齐?
|
8
wxw752 2021-03-29 14:41:38 +08:00
工整这个概念很模糊,因为字体太多了。
我觉得可以做到判断写的字和训练集所用字体的相似程度。 |
9
crackhopper 2021-03-29 14:41:43 +08:00
@yaphets666 如果理解指的是合理打分,不一定,我觉得大概率能;如果理解指的是表达机器本身的情感,目前是不行。目前机器缺乏自我认知的建立的机制,我觉得是前馈网络本身的缺陷,但目前也就前馈网络容易训练和改进。
|
11
pkookp8 2021-03-29 14:44:29 +08:00 via Android
|
14
ch2 2021-03-29 15:03:28 +08:00 via iPhone
工整的评分标准由谁来定?这个并不是代码的问题,但是是最重要的,这个没有人解决你就什么也办不到,也会是你产品的核心竞争力,但是很遗憾,它并不在你的代码上
|
15
flankechen 2021-03-29 16:38:03 +08:00
请先定义什么是工整,cost function,然后扔进网络学习就可以拉
|
16
cheneydog 2021-03-29 16:42:08 +08:00
“标准版” 和 “手写版” 二值化后异或,1 面积 /总面积 为评分
|
17
raaaaaar 2021-03-29 17:14:46 +08:00 via Android
找 20 个人,手动打分(狗头
|
18
shuxiaokai 2021-03-29 17:14:49 +08:00
看你指定的标准是哪种字体了
|
19
kergee 2021-03-30 08:36:17 +08:00
用过象辞 AI 智能练字笔套装
|
20
q149072205 2021-03-30 11:37:42 +08:00
你这要有一个字体做为参照字体,不然你这识别就不标准了。。
|