V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Exxfire
V2EX  ›  软件

PDF 极致压缩工具

  •  
  •   Exxfire · 2023-11-16 13:54:15 +08:00 · 1325 次点击
    这是一个创建于 380 天前的主题,其中的信息可能已经有所发展或是发生改变。

    各位大佬,PDF 文档压缩的极限是多少(100MB-->??MB)?什么工具比较好用?

    第 1 条附言  ·  2023-11-16 16:49:17 +08:00
    我的文档是一本扫描的书,一共有 304 页,黑白色,压缩前大小为 125 MB ,使用 MS printer 打印后大小下降到 105 MB, 重复该过程无效果。
    使用 abbyy fine reader 压缩的过程中,我办公的电脑卡到快要死机,遂暂时放弃。
    其他方式暂时未尝试。
    14 条回复    2023-11-17 12:13:00 +08:00
    lovedebug
        1
    lovedebug  
       2023-11-16 14:00:37 +08:00   ❤️ 1
    abbyy fine reader15, 一般图片 PDF 在 OCR 后只剩下 10MB 左右
    dsgdsfh
        2
    dsgdsfh  
       2023-11-16 14:21:11 +08:00   ❤️ 1
    我有时候用 Windows 的 PDF 打印机,能缩小很多
    passive
        3
    passive  
       2023-11-16 14:36:51 +08:00 via Android   ❤️ 1
    要看是什么 pdf ,100 多 MB 估计是扫描的书,字体的压缩 op 大概率看不上。
    对于扫描的 pdf ,中文的不知道,单色的字母能用 jbig2 压一圈瘦身明显。通用的方法能把 stream 展开重新压缩。现成的工具能用 pdfsizeopt+tinypng.com (+jbig2 ),虽然效果不是极致,大多情况确实能压缩
    linuxgo
        4
    linuxgo  
       2023-11-16 15:38:21 +08:00   ❤️ 1
    如果是图片基本压不了,转成文字就会小很多
    cwcauc
        5
    cwcauc  
       2023-11-16 16:22:30 +08:00   ❤️ 1
    如果是图片 PDF ,可以先用 PDF Patcher 提取图片压缩,再合并为 PDF
    kokutou
        6
    kokutou  
       2023-11-16 16:58:19 +08:00   ❤️ 1
    图片 pdf ...看你能接收损失多少质量...

    如果你自己 ocr, 那就是压缩完怕是 1m 都不到
    retrocode
        7
    retrocode  
       2023-11-16 17:05:15 +08:00   ❤️ 1
    wps 有 PDF 压缩功能, 不过是会员专享
    LLaMA2
        8
    LLaMA2  
       2023-11-16 17:14:04 +08:00   ❤️ 1
    OCR 直接识别成文字

    125M --> 125K
    cyningxu
        9
    cyningxu  
       2023-11-16 17:35:15 +08:00 via Android   ❤️ 1
    看起来是图片? ocr 成文字试试
    Foxkeh
        10
    Foxkeh  
       2023-11-16 17:38:55 +08:00   ❤️ 1
    Foxit Phantom, 不过是收费的. 试过把高项第四版 300 多 MB 的扫描书压缩到了 85MB
    zsj1029
        11
    zsj1029  
       2023-11-16 18:52:11 +08:00   ❤️ 1
    https://www.pdf24.org/zh/
    完全免费的各类 pdf 工具
    还有本地客户端
    cnoder
        12
    cnoder  
       2023-11-17 01:27:44 +08:00   ❤️ 1
    图片就转文字
    Exxfire
        13
    Exxfire  
    OP
       2023-11-17 09:26:53 +08:00
    @ye4tar
    @cyningxu
    @cnoder
    不是自己使用图片制作的 pdf,是朋友给到的 pdf 书籍, 因为鼠标无法选定当中的文字,我简单的认为是由实体书扫描而成,因为认知当中,由 word 文档转成的 pdf 文档,当中文字部分是可以选中的。
    刚刚想了想,排版很工整,似乎也不像是实体书扫描的。。。
    yangwcool
        14
    yangwcool  
       2023-11-17 12:13:00 +08:00 via Android
    可以先用 pdf 补丁丁这个软件打开,看看是不是图片转的。如果是图片转的,就把图片提取出来,再用图片处理软件批量调整图片大小(这里你需要根据纸张大小和 ppi 算一下目标分辨率),然后再把这一堆图片转换成 pdf 。推荐 irfanviewer ,用它就不用算分辨率了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2711 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 10:10 · PVG 18:10 · LAX 02:10 · JFK 05:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.