• 请不要在回答技术问题时复制粘贴 AI 生成的内容
LonelyM
V2EX  ›  程序员

GPT 完胜 Claude

  •  
  •   LonelyM · 2h 53m ago · 947 views

    🚀根据 DeepSWE (最佳编码基准)排名:

    gpt-5.5 xhigh 完胜 opus-4.8 max

    所以,聪明的你,选 Codex 还是 Claude code ?🙂

    11 replies    2026-06-03 00:25:58 +08:00
    cairnechen
        1
    cairnechen  
       2h 48m ago
    4.8 等这波付费用户测试弄完了应该是会回升的,当然,这不影响我骂 A➗
    409164
        2
    409164  
       2h 42m ago
    claude max 连 gpt5.5 high 都打不过吗?真的假的
    Retas
        3
    Retas  
       2h 41m ago
    聪明的人会选择双持~
    lujiaosama
        4
    lujiaosama  
       2h 41m ago
    @Retas 两个都同时拉裤子呢。得等外星人发模型了。
    409164
        5
    409164  
       2h 39m ago
    看了一下,做的只是 PASS@1 情况下的排行榜,实际上经过简单修正,还是 claude 的结果可用性更高
    AS4694lAS4808
        6
    AS4694lAS4808  
       2h 24m ago via Android
    没人用 gemini 3.5 flash 么,我觉得也挺好用的,而且速度能到 300+
    Retas
        7
    Retas  
       2h 10m ago
    @lujiaosama 两个都拉了就是天才程序员陨落了
    lujiaosama
        8
    lujiaosama  
       1h 59m ago
    @Retas 天才程序员选择用国模凑合,天才程序员发现自己服务器被干崩了
    dingawm
        9
    dingawm  
       1h 26m ago
    @409164 #5 "实际上经过简单修正,还是 claude 的结果可用性更高"
    这个简单修改的结果哪里能看呢
    409164
        10
    409164  
       1h 21m ago
    @dingawm 使用体感和员工反馈
    dingawm
        11
    dingawm  
       1h 10m ago
    @409164 #10 6
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1260 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 17:36 · PVG 01:36 · LAX 10:36 · JFK 13:36
    ♥ Do have faith in what you're doing.