gosky
V2EX  ›  问与答

如何基于 LLM 翻译文图表混排的 PDF 文件?

  •  
  •   gosky · 11 days ago · 972 views
    有份 PDF ,内容如下图所示。本来也有中文翻译版,但是翻译的太差了。
    我曾经自己写脚本,调用 LLM API 翻译 EPUB 文件。
    但这种 PDF ,还是文图表混排的 PDF ,完全没头绪。

    6 replies    2026-05-12 10:59:15 +08:00
    aikilan
        1
    aikilan  
       11 days ago
    试试 paddleOCR
    SuperDaniel313
        2
    SuperDaniel313  
       11 days ago

    是想要这样的效果吗?
    gosky
        3
    gosky  
    OP
       10 days ago
    @SuperDaniel313 是的。不过你这个没图片和表格
    stargo
        4
    stargo  
       10 days ago
    mineru
    rpish
        5
    rpish  
       10 days ago
    先转 LaTex
    iorilu
        6
    iorilu  
       10 days ago
    mineru 有 api 调用方式, 可以官方看看

    当然了, 有 gpu 也可以本地运行, 不过很慢
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5286 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 63ms · UTC 08:36 · PVG 16:36 · LAX 01:36 · JFK 04:36
    ♥ Do have faith in what you're doing.