V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
onedge
V2EX  ›  程序员

GLM 5.1 开源了, https://huggingface.co/zai-org/GLM-5.1

  •  
  •   onedge · 11 小时 21 分钟前 · 1692 次点击
    11 条回复    2026-04-08 11:17:11 +08:00
    gotoschool
        1
    gotoschool  
       11 小时 7 分钟前
    我去 得 2t 的显卡才能爬?
    onedge
        2
    onedge  
    OP
       10 小时 53 分钟前
    @gotoschool 希望快出个 flash turbo air 哈哈
    yulon
        3
    yulon  
       4 小时 24 分钟前
    5.1 是不是蒸过 Grok 了,要被气笑了,遇到我压缩过的短 URL ,会自作聪明修复成一个看起来正常但是没有一个字符是对的假 URL ,哪怕它自己访问过是 404 还要回复给我,犟得要死,以前只有 Grok 会出这种情况😅
    Geon97
        4
    Geon97  
       3 小时 0 分钟前
    反正跑不起来
    akiyamamio
        5
    akiyamamio  
       2 小时 24 分钟前
    这也不是让个人跑的吧,我猜是各个 coding plan 可以支持 glm5.1 了
    beyondstars
        6
    beyondstars  
       1 小时 56 分钟前
    开源可以让更多平台自部署 glm5.1 ,减轻官方服务器的压力。
    onedge
        7
    onedge  
    OP
       1 小时 50 分钟前
    @akiyamamio 个人跑硬件没 20 万以上下不来吧,乖乖买套餐吧,20w 能用多少年
    capric
        8
    capric  
       1 小时 49 分钟前
    @onedge 跑 fp8 要 8x h200 ,加上其他硬件,约 200w
    onedge
        9
    onedge  
    OP
       1 小时 35 分钟前
    @capric 内行,我还在想串 4 台 512 的 mac studio 哈哈
    capric
        10
    capric  
       46 分钟前   ❤️ 1
    @onedge 可以跑的
    带宽 4x M3 Ultra (约 4 x 0.8 = 3.2 TB/s )对 8x H200 ( 8 x 4.8 = 38.4 TB/s )约 1/12
    8x H200 的公开示例输出吞吐约 ~526 tok/s
    理想上限约 40~50 tok/s
    考虑多机通信开销后,单路交互常见可能落到 约 3~10 tok/s
    onedge
        11
    onedge  
    OP
       35 分钟前
    @capric 👍我想着也最多是“能”跑,但离可用体验还远
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5256 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 03:52 · PVG 11:52 · LAX 20:52 · JFK 23:52
    ♥ Do have faith in what you're doing.