• 请不要在回答技术问题时复制粘贴 AI 生成的内容
lynn1su
V2EX  ›  程序员

qwen 也用上 DeepSeek 的缓存技术了。我这居然有 90%了,套餐是 coding plan 的 qwen3.7 plus

  •  
  •   lynn1su · 1 day ago · 3009 views
    coding plan 的成本降下来后会不会向公众开放?
    18 replies    2026-06-23 23:23:44 +08:00
    yh7gdiaYW
        1
    yh7gdiaYW  
       1 day ago
    就前几天没有,被喷惨了后把自动缓存加上了。我这儿 cc+qwen3.7max 的缓存命中率有 92%+
    bbbblue
        2
    bbbblue  
       1 day ago
    缓存命中率和用不用 ds 的技术没关系吧
    用 ds 的是超便宜缓存+长时间缓存(小时有时天级别)
    ifoto
        3
    ifoto  
       1 day ago
    coding plan 还能抢到吗
    chenluo0429
        4
    chenluo0429  
       1 day ago via Android   ❤️ 1
    你在讲些什么啊?能不能先学习下什么是缓存?这些基础知识随便找个 AI 都能给你安排的明明白白,不要在公共场合暴露自己的无知
    anivie
        5
    anivie  
       1 day ago
    是阿里百炼的 coding plan 吗,之前去问他们有没有 qwen3.7 还说没有
    xiaomushen
        6
    xiaomushen  
       1 day ago
    token plan 里有好模型
    coding plan 好像买不到了
    codehz
        7
    codehz  
       1 day ago
    不能只看比例啊。DeepSeek 它的缓存的价格是比较低的。(相对来说)
    mingtdlb
        8
    mingtdlb  
       19h 6m ago
    国产只有 deepseek 真诚。其他厂商都爱玩套路
    TK6
        9
    TK6  
       18h 52m ago
    coding plan 是按次数计费的怎么算缓存?
    abc0123xyz
        10
    abc0123xyz  
       18h 48m ago
    coding plan 给的是 qwen3.7plus 没给 max 版本
    son012
        11
    son012  
       18h 33m ago
    qwen3.7plus 使用体验不太好吧?我用了 qodercn 的订阅,但是改个东西就一直乱改
    lynn1su
        12
    lynn1su  
    OP
       18h 10m ago
    @TK6 #9 我对接到我的 newapi 后发现上周是完全没有缓存的,这周缓存命中率突然变得和 deepseek 一样高了
    JerningChan
        13
    JerningChan  
       17h 52m ago
    缓存难道不是你每次调用 ai 的 api 时,你这次发送的内容和上几次的对话内容有高度重叠的内容,才会缓存命中吗?
    yh7gdiaYW
        14
    yh7gdiaYW  
       17h 23m ago
    @JerningChan qwen 还真有自己的想法,3.7 max 刚发布时没有其他家那种隐式缓存,必须显式创建要缓存的内容。后来被喷改了后还要嘴硬"隐式缓存命中率不确定(加粗)"。3.7 plus 不知道有没有类似的逻辑
    JerningChan
        15
    JerningChan  
       16h 31m ago
    @yh7gdiaYW 哦?这样吗?那还真坑,我是自己部署 qwen3.6 + 线上用 ds / opus 那些,之前用了几次线上的 qwen3.6-max 那些,消耗太快,一点都不爽😂
    asd999cxcx
        16
    asd999cxcx  
       16h 18m ago
    百炼的 tokenplan 经用么
    nescirem
        17
    nescirem  
       13h 38m ago
    @asd999cxcx 我的百炼 tokenplan 标准版 一周用了 20%,感觉差不多刚好够用 1 个月
    Rorysky
        18
    Rorysky  
       4h 23m ago
    @chenluo0429 缓存就是重复信息输入,问的轮数越多缓存越高,缓存高说明上下文管理不当
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   958 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 53ms · UTC 19:46 · PVG 03:46 · LAX 12:46 · JFK 15:46
    ♥ Do have faith in what you're doing.