aikilan
V2EX  ›  OpenAI

GPT 5.5 的降智是不是有点严重

  •  
  •   aikilan · 15h 56m ago · 3550 views

    最近任务往往需要引导 2 次以上,稍微复杂点的引导 3-4 次都有,太奇怪了

    31 replies    2026-05-21 16:35:10 +08:00
    sockpuppet9527
        1
    sockpuppet9527  
       15h 35m ago
    +1

    怀疑是新模型发布前后,算力被重新分配。
    aikilan
        2
    aikilan  
    OP
       15h 24m ago
    @sockpuppet9527 完全属于被服务商拿捏的
    YanSeven
        3
    YanSeven  
       15h 19m ago
    前几天一片夸 codex gpt 5.5 爆杀 claude code 的。

    看来 MaaS 这东西,比传统的各种 aaS 都要不稳定。
    MrL21
        4
    MrL21  
       15h 16m ago
    是的,变差了很多
    ximaoyang
        5
    ximaoyang  
       15h 13m ago
    gpt 聪明过吗?在 cc 面前就是个垃圾
    shunia
        6
    shunia  
       15h 13m ago
    啥问题?昨天在 vscode 和 cli 里都用了,感觉还是一样,能力上没啥变化啊?
    不过出了个新 bug 就是,有一个项目一直触发 cybersecurity 的提示,没法用。去 codex 的 issue 里看了一眼,提的 issue 都被直接关了,也不处理。
    shunia
        7
    shunia  
       15h 12m ago
    @ximaoyang #5 ??这是从何说起?
    409164
        8
    409164  
       15h 11m ago via iPhone
    @ximaoyang 确实
    lel020
        9
    lel020  
       15h 10m ago
    我以前用 medium 的,现在用 xhigh ,起码没比以前的 medium 降智,
    tanrenye
        10
    tanrenye  
       15h 8m ago
    没觉得降智,工作的任务都能胜任
    ktyang
        11
    ktyang  
       15h 7m ago
    是的,昨天一个小工具翻来覆去搞了好几遍,每次都有问题,害得我折腾了好久,以前肯定是一次成的。
    lemontrees
        12
    lemontrees  
       15h 2m ago
    感觉还好
    YangJiLei
        13
    YangJiLei  
       15h 0m ago
    昨天不是额度偷偷刷新吗,我感觉现在额度消耗的好快
    Yasuke
        14
    Yasuke  
       15h 0m ago
    @ximaoyang 你真的用过吗
    laved
        15
    laved  
       14h 55m ago
    @ximaoyang 我用 copilot 的时候用过 cc 反而觉得 cc 比不上 gpt
    sockpuppet9527
        16
    sockpuppet9527  
       14h 24m ago
    @aikilan 之前 opus 4.7 发布前夕,opus 4.6 降智也很厉害。祖传手艺了算是。
    wy315700
        17
    wy315700  
       14h 21m ago
    @YangJiLei 降智,额度变少

    都是基操了
    undefine2020
        18
    undefine2020  
       14h 20m ago
    5.4 也降了,昨天第一次碰到让它改个 shell 脚本都出问题的
    urfree
        19
    urfree  
       13h 52m ago
    5.6 要来了吧
    evemoo
        20
    evemoo  
       13h 50m ago
    +1 ,胶水代码特别多,简单功能搞得特别复杂
    yuyue001
        21
    yuyue001  
       13h 42m ago
    除了 claude ,有哪个值得推荐的模型,和 gpt 互补使用。现在降智的很难受。
    ximaoyang
        22
    ximaoyang  
       12h 38m ago
    除了 cc 其他的都别用。cc 回答简短。不知道就说不知道。gpt 那套真扛不住,回答特别长,不懂瞎回答。真的到干活的时候就来回的在一个地方打转。
    Zarhani
        23
    Zarhani  
       11h 29m ago
    连 openrouter 上的 api 也降智了
    isnullstring
        24
    isnullstring  
       11h 17m ago
    +1 ,今天写的计划和代码开始变得弱智起来,自己定的计划却不按计划来
    aikilan
        25
    aikilan  
    OP
       11h 9m ago
    @isnullstring 之前经常输出的计划能够把我没注意到的也列出来。。。现在提问频率降低,输出的东西就是一大坨
    Baymaxbowen
        26
    Baymaxbowen  
       10h 59m ago
    +1 ,一个小项目经常丢三落四的
    v2306
        27
    v2306  
       10h 58m ago
    更新完,上下文窗口的进度条怎么没有了
    fuchish112
        28
    fuchish112  
       10h 35m ago
    咋一个个跟着手机厂商学,新的出来,旧的就故意卡顿,降拍照画质等等手段
    bellx
        29
    bellx  
       10h 34m ago
    是的,之前一遍过的东西现在要返工,我用的还是 5.5 xhigh
    cirzear
        30
    cirzear  
       10h 18m ago
    @bellx 同感,同样复杂度的任务,现在总是只改差不多就说改完了,闭环逻辑也不如之前,需要‘鞭子抽它’才去一步步干
    isnullstring
        31
    isnullstring  
       8h 56m ago
    @aikilan 是的,代码里已经有相应变量,代码也是他自己写的,写计划时候又创建个相同含义的变量,那计划我审得恼火 丢给 opus 审,审出 10 个问题 5 个严重问题
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1251 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 83ms · UTC 17:31 · PVG 01:31 · LAX 10:31 · JFK 13:31
    ♥ Do have faith in what you're doing.