V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
a33291
V2EX  ›  问与答

请问是否有软件能自动生成扫描版 PDF 的书签或目录?

  •  
  •   a33291 · 2022-08-30 13:58:11 +08:00 · 945 次点击
    这是一个创建于 851 天前的主题,其中的信息可能已经有所发展或是发生改变。

    一般扫描版 PDF 每一页都是一张图,并不是内嵌的文字. 现在遇到这类资料只能手动加书签,我知道abbyy可以通过ocr技术来编辑这类扫描版pdf,所以想问哈是否有工具能够更进一步,利用ocr识别结果自动构造书签目录?

    3 条回复    2022-08-31 09:00:31 +08:00
    imzcg2
        1
    imzcg2  
       2022-08-30 14:19:17 +08:00
    我专门找过还真就没找到,一般都是取可靠网站拿取书的目录然后用软件做进去
    ChaosesIb
        2
    ChaosesIb  
       2022-08-30 20:13:48 +08:00 via Android
    ABBYY 就可以,也可以 OCR 后用 PDF-XChange Editor 通过样式提取书签。
    a33291
        3
    a33291  
    OP
       2022-08-31 09:00:31 +08:00
    谢谢各位

    目前应该都只能先转 word ,然后通过 word 生成目录,再转换为 pdf 。这些步骤都要手动完成,目前 ocr 识别效果最好的应该还是 abbyy ,一些 GB 文档的文字样式比较麻烦。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2541 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 11:00 · PVG 19:00 · LAX 03:00 · JFK 06:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.