V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
WaterWestBolus
V2EX  ›  问与答

每个字按照笔画拆分,不同笔画不同颜色

  •  
  •   WaterWestBolus · 2022-04-19 15:07:30 +08:00 · 1012 次点击
    这是一个创建于 983 天前的主题,其中的信息可能已经有所发展或是发生改变。

    一个关于汉语教学里面拆字的问题,需要不同笔画标出每笔的顺序,也要让每个笔画使用不同颜色区分。总字数可能有点多,希望有批量的方法。

    请问有什么现成的程序可以这样标注嘛?(试了 word 和 ppt 基本上只能根据部首或者连通图来区分,ps 的话工作量太大了也不准确)

    以及如果没有的话,是否可以从哪些数据库或者什么网站找到每个字的笔画顺序和每笔的起末位置、笔画形状呢?

    上面的问题已经自己找过,没有能找到答案。特此来求助,谢谢~

    拆字.jpg

    5 条回复    2022-04-19 16:46:29 +08:00
    renmu123
        1
    renmu123  
       2022-04-19 15:12:17 +08:00 via Android   ❤️ 1
    你要先确定字体,市面上应该有类似的产品,js 的话有 chchar 可以处理
    mekingname
        2
    mekingname  
       2022-04-19 15:17:13 +08:00
    这个简单,可以通过神经网络训练以后自动生成。
    mekingname
        3
    mekingname  
       2022-04-19 15:21:08 +08:00
    这个技术叫做 instance segmentation ,使用 maskrcnn 网络来做。你只需要人工标注一两百个汉字就可以了,然后它可以自动泛化到所有汉字,甚至包括日语和部分韩语。
    WaterWestBolus
        4
    WaterWestBolus  
    OP
       2022-04-19 16:34:10 +08:00
    @renmu123 字体的话,正常书写的字体比如楷体、宋体都可以。您说的 chchar 我没有搜到,可否给个链接呢?

    @mekingname 自己分割的话可能还是有点蛋疼啊...工作量有点大,想找一个基于书写原理的而不是基于神经网络的方法,我先试一下看看。谢谢
    WaterWestBolus
        5
    WaterWestBolus  
    OP
       2022-04-19 16:46:29 +08:00
    @renmu123 谢谢,根据您的提示找到了,但不是 chchar 而是 cnchar 。源码在此 https://github.com/theajack/cnchar
    如有朋友有更好的解决方案可以继续回复~感谢大家。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2791 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 03:14 · PVG 11:14 · LAX 19:14 · JFK 22:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.