V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Ulduar
V2EX  ›  编程

claude-opus-4-6 大家实际使用感觉怎么样?

  •  
  •   Ulduar · 1 天前 · 989 次点击

    claude-opus-4-6 目前在大模型编程这方面看上去排名第一了 想问问大家的体验

    8 条回复    2026-02-09 18:54:47 +08:00
    paidaxtis
        1
    paidaxtis  
       1 天前
    实话说,我在 sonnet 4.5 后,通常的工作问题用 claude code 基本上都能解决了。后续也是跟着最新的模型走,过了能完成常见代码问题的甜蜜点后,都体感不出差异。
    不过最难的问题,还是直接 codex ,用 5.2 或 5.3-codex 的 high/xhigh
    stinkytofux
        2
    stinkytofux  
       1 天前
    周末登了两天的福利中转站, 4.6 非常好用, plan 聊清楚的任务, 几乎不会出错, 代码一次编译成功. 不像其他模型丢三落四的.
    hanguofu
        3
    hanguofu  
       23 小时 46 分钟前 via Android
    @stinkytofux 求推荐福利中转站,谢谢!
    letitbesqzr
        4
    letitbesqzr  
       23 小时 26 分钟前
    感觉和 opus 4.5 差不了多少 , 4.5 已经能实现我绝大部分需求了... 贵还是最大的问题

    最近几天 5.3-codex 用的比较多, 量大管饱 , 价格实惠.
    stinkytofux
        5
    stinkytofux  
       23 小时 12 分钟前
    @hanguofu V 站不是天天有人发么
    stinkytofux
        6
    stinkytofux  
       23 小时 11 分钟前
    @letitbesqzr 朋友, 5.3-codex 怎么买的? 指个路
    gadfly3173
        7
    gadfly3173  
       23 小时 10 分钟前
    感觉比 4.5 聪明一点,速度快一点
    a632079
        8
    a632079  
       17 小时 55 分钟前   ❤️ 1
    指令遵从性比 opus 4.5 差很多。
    经常定义了多个 Phrase ,比如说 Phrase 2 调用 Codex ,Gemini 进行多模型分析需求,会被主动跳过。
    再比如生成代码原型,后端使用 codex 生成指令会高很多,opus 4.6 往往选择这时候跳过。
    最重要的是实施完成后,需要进行代码指令控制,使用多模型审核,以及单元测试,一不注意 opus 4.6 就跳过了。
    Opus 4.5 在使用相同的 skills 和 prompt 都没有这样的问题。

    以及在调试错误,opus 4.6 会陷入死循环。比如说测试失败,需要更新一下 snapshot ,尝试方案 A->B->C->A 会循环重试。
    * 而 Codex 5.3 在尝试 2-3 cycle 后就解决了
    * Opus 4.5 虽然不能解决,但是也能告知可能路径,不会循环重试
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2413 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 98ms · UTC 04:50 · PVG 12:50 · LAX 20:50 · JFK 23:50
    ♥ Do have faith in what you're doing.