V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
jdz
V2EX  ›  程序员

我的使用姿势不对么, 我感觉 ds 很差劲啊, 比 grok3 差远了, 编程相关问题试了几次都表现很差

  •  1
     
  •   jdz · 22 天前 · 15549 次点击

    比如 example.nacos.com 这是我的 nacos 地址, 帮我写个 bash 脚本, 查询 cpp_long_link 命名空间下的所有服务信息, grok 可以一次写对, deepseek 就会忘记 pageSize 这个参数

    164 条回复    2025-03-29 10:15:35 +08:00
    1  2  
    honkew
        1
    honkew  
       22 天前
    那就对了
    willchen
        2
    willchen  
       22 天前
    那就对了
    whoosy
        3
    whoosy  
       22 天前
    新版本的确实感觉有问题
    DIO
        4
    DIO  
       22 天前   ❤️ 1
    ds 何德何能和 grok 比,现在中文 qwen QWQ ,英文 Grok 基本是我这个穷鬼的标准答案了。虽然订阅了 chatgpt 但是这两个月很少动用了。ds 用来平替百度还可以。claude 没开会员,不知道付费版体验怎么样。
    windyboy
        5
    windyboy  
       22 天前   ❤️ 3
    唯一可以指责你的是政治不正确
    jdz
        6
    jdz  
    OP
       22 天前   ❤️ 2
    @DIO 我也感觉, 感觉铺天盖地吹捧 ds, 试水了几次都被劝退了
    Donaldo
        7
    Donaldo  
       22 天前
    最近写 CUDA ,grok3 是唯一能写对的,其他像 o1,o3-mini-high,claude-3.7(或 thinking),r1,gemini-pro(或 flash-thinking)都不行。
    MRG0
        8
    MRG0  
       22 天前
    我无法触发他的第二次回答
    javazero
        9
    javazero  
       22 天前
    马斯克实在给的太多了,ChatGPT plus 停了。主力直接用 grok 3 免费而且量大管饱
    zbw0414
        10
    zbw0414  
       22 天前
    @DIO ds 幻觉那么严重各种瞎编, 你居然让他平替百度.....
    真平替还是 perplexity 吧. 搜索真的接受不了幻觉.
    jdz
        11
    jdz  
    OP
       22 天前
    @javazero 虽然免费, 但是感觉质量挺好的
    bronyakaka
        12
    bronyakaka  
       22 天前
    gro3k 本来就是目前最强的,差点很正常。
    lzgshsj
        13
    lzgshsj  
       22 天前   ❤️ 39
    我代码主力 claude 的,前两天写了两个 awk 脚本,claude 3.7s 完全不对,ds r1 思考了 7 分钟,完美符合要求

    只能说每个人遇到的问题都千奇百怪,哪怕是同一家 AI 也不是每次答案都一样。
    同样问题,你问出来不对,我问出来对了。刚才问的不对,现在问对了……只能说不要只看一家,平时也可以多换着问问。
    zbw0414
        14
    zbw0414  
       22 天前   ❤️ 20
    @jdz 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费
    dapang1221
        15
    dapang1221  
       22 天前
    我现在日常琐事问题 deepseek R1 ,需要创意及比较新颖的问题 grok ,写逻辑代码 claude 3.7 ,生成前端 UI deepseek R1 或 V3
    ahdw
        16
    ahdw  
       22 天前
    @zbw0414
    > 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费

    太赞同了。主要就是因为没有使用门槛,而且背后的「浙江六小龙」都在宣传和公关方面投入了很多,让 DeepSeek 充分曝光了。

    为我自己的这篇文章引流: https://kutt.it/Z4bAtw
    youthfire
        17
    youthfire  
       22 天前 via iPhone
    claude3.7 thinking 稳稳第一,grok3 第二,其他都是玩具
    NoOneNoBody
        18
    NoOneNoBody  
       22 天前
    ds 有个最奇怪的现象是在其他 ai 没见过的,回答代码居然会漏一边括号这种低级错误
    代码质量我觉得过得去,比 copilot 和 genmini 好,gpt 就暂时判断不出哪个更佳,当然说的都只是免费 web 之间比较
    qinxs
        19
    qinxs  
       22 天前 via Android   ❤️ 3
    对大多数普通人来说 deepseek 已经够用了

    编程领域 我提出的问题 ds 也能完美解决 80%以上

    最后 马化腾财富全球排名 36 所以他很穷!!
    wsbqdyhm
        20
    wsbqdyhm  
       22 天前 via iPhone
    文字工作者,深度使用,感觉 grok3 和阿里新出那个差不多,ds 在这两个之后,ds 比 chatgpt 好,gpt 降智太弱了,我说的都是免费版
    Cloud9527
        21
    Cloud9527  
       22 天前
    最近再用 qwq-plus 感觉还可以,主要是吐字快!
    evilStart
        22
    evilStart  
       22 天前   ❤️ 14
    deepseek 不行为什么美国人这么害怕?这么讨厌国产的还是 run 吧,在这里苦了你们了
    kyor0
        23
    kyor0  
       22 天前   ❤️ 5
    只拿小红分滚出这个论坛
    ZSeptember
        24
    ZSeptember  
       22 天前   ❤️ 4
    llm 都不是很稳,不能因为单一场景,单次使用有点问题,就否定整个模型。。
    Donaldo
        25
    Donaldo  
       22 天前
    @ZSeptember #24 评论区完美体现了你这个观点,大家针对不同使用场景,分别对不同模型进行了赞扬和批判~
    iamsad3508
        26
    iamsad3508  
       22 天前
    温度调到 0 ,再试
    takanashisakura
        27
    takanashisakura  
       22 天前
    @zbw0414 #14 qwq-plus 也不用翻墙
    9ki
        28
    9ki  
       22 天前
    这个月高强度用 ai 学习,claude 3.7 ( Thinking )/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队,grok3 ,gpt-4.5 o1-mini 纯纯路边

    我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来,像二楼那种 claude 都没用过,不知道哪来的自信参与讨论
    Stunt4013
        29
    Stunt4013  
       22 天前
    @Donaldo 刚出的 gemini 2.5 pro 也很强
    EricYuan1
        30
    EricYuan1  
       22 天前
    别的不说,手机 app ,这几个中 grok 做的最好看
    qiaobeier
        31
    qiaobeier  
       22 天前
    通用的 deepseek (翻译,帮小孩写作文,润色文档,甚至还做过 WEB 项目配色方案等等,结果都很优秀)。 写代码只使用 claude 。有买 GTP 但基本不用了。
    lscho
        32
    lscho  
       22 天前
    因为 ai 覆盖的场景太广泛,所以看测试就行。只有测试才能尽可能覆盖大部分场景。

    单一场景谁都有可能出错
    xbtx3790
        33
    xbtx3790  
       22 天前
    grok3 确实能打
    k9982874
        34
    k9982874  
       22 天前 via Android
    先不说质量,输出速度 ds 是最慢的。。。
    fancy2020
        35
    fancy2020  
       22 天前
    百度和 Google 的区别
    clino
        36
    clino  
       22 天前
    我其实是从 deepseek v2 开始用的,当时就感觉很好用,切成 v3 以后好像没有明显更好的感觉
    当然我没怎么用过 claude 所以没有明显对比,但是 deepseek 一直给我感觉是相当好了
    cookii
        37
    cookii  
       22 天前 via Android
    体感 grok 确实很好用,比其他都强
    zhwguest
        38
    zhwguest  
       22 天前
    刚开始出来其实感觉很不错,但是后来慢慢觉得越来越不那么惊艳了...
    LittleYangYang
        39
    LittleYangYang  
       22 天前
    deepseek 我从 v2 开始用它去处理数据,当时主要是相比其他家太便宜了,效果还好,这价格很难让人拒绝(),就是并发非常低
    新的 R1 主要强在它的强化学习策略,落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的,说的话非常似人,比其他模型更像贴吧老哥,但是编数据的幻觉倾向也很厉害,也有丢上下文的倾向,很多生成结果基本上义眼就能看出来是 deepseek 写的。
    最近我在信息抽取工作上比较了几个模型,在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右,json 格式化约束的稳定度倒是还挺好。
    其他的模型实际用起来其实感觉 grok3 幻觉也严重,gemini deepresearch 是真好用啊,谷歌的信息来源还是太猛,开了 gemini advanced ,下个月想把 gpt plus 关掉了,o3 真废物....
    wweerrgtc
        40
    wweerrgtc  
       22 天前
    @lzgshsj #13 思考 7 分钟也太慢了吧, 有没有问答链接可以看看呀
    seven777
        41
    seven777  
       22 天前
    它本来就很差,从没象吹的那么优秀过。
    我真心佩服的就 Claude ,Grok
    docx
        42
    docx  
       22 天前 via iPhone
    编程用 Claude Sonnet
    Yuanlaoer
        43
    Yuanlaoer  
       22 天前
    我记得最常见的一句评论是:
    deepseek 的逻辑推理能力很强
    我当年参加物理竞赛和辩论赛的时候,都不知道原来有这么多深耕逻辑学的人士深藏网络
    MYDB
        44
    MYDB  
       22 天前
    都不好用,一个问题多问几家,然后选择自己认为是正确的答案,也不排除都不对,一些小众领域还是不适合 ai
    YooboH
        45
    YooboH  
       22 天前   ❤️ 14
    从我个人体验来看,ds 中文回复质量比免费的 4o 和 gemini 要好上不少,我写论文有时遇到复杂的问题他都能够给不错的参考回复。不过他指令依从性不太好,很容易发散,需要自己注意限制。付费版的 chatgpt 很久没有续费了就没资格评价了。
    另外,光是他坚持开源权重这一点就让我没有任何理由批评他了,所谓的什么营销和这一点相比算的了什么。楼里的某些人的回复可真是让人大开眼界,国产是多大仇啊
    skiy
        46
    skiy  
       22 天前
    不好用就别用了吧。这样它就不要总是“服务器不可用”了。
    刚刚提交了个提问,还不错。而同个问题,ChatGPT 只给出文字描述,必没有给代码。DeepSeek 给出代码实例了。
    自从之前一直给“服务器不可用”,就很长时间不用了,改用 Kimi 。今天回来用,居然可用。不错不错。

    代码这个,一般情况都是要多个平台提问,再综合答案得出自己的解决方案。没有哪个是最好的。ChatGPT 相对来说,Shell 给的非常不错,但有时要使用 Kimi 补充。Grok 有限额,DeepSearch 有时会不可用。其它的比如 ChatGPT 和 Gemini 也一样情形。
    BelovedOne
        47
    BelovedOne  
       22 天前
    目前来说 Grok 体验最好,非常的专业,效率也很高,思考和搜索的过程非常干练。ChatGPT 也很棒,不过结果总是略逊一筹。
    rpish
        48
    rpish  
       22 天前
    op 用的 v3 还是 r1 ?
    话说 grok3 刚发布不久,r1 发布 2 个多月了,按照大模型半年一代的迭代周期,有差距也很正常。
    wwhc
        49
    wwhc  
       22 天前   ❤️ 1
    在开源模型中 DeepSeek 和 Qwen 是目前最好的,自建成本也并不是高不可攀,我觉得没有责难的理由,那些闭源模型没有匹配的可能性
    elone
        50
    elone  
       22 天前
    我今天写一个较为复杂点的 swiftui 的代码, 最终用下来只有 grok3 帮我把代码写出来了, 对比了 ds, 还用了最新的 gemini 2.5, 都完全跑不起来. 只有 grok3 最终实现了, 而且, 代码风格居然很贴合我的习惯.
    jdz
        51
    jdz  
    OP
       22 天前 via Android
    @rpish 最新的 v3
    NanFengxuan
        52
    NanFengxuan  
       22 天前 via iPhone
    DeepSeek 就是一坨,让它写一段 matlab 代码结果死机了,一直重复输出一个字母
    Meursau1T
        53
    Meursau1T  
       22 天前   ❤️ 2
    @zbw0414 ds 有幻觉没错,但是你推荐 perplexity 就不对了,这东西还不如 ds 和 qwen 呢,而且注水非常严重,印度人搞的垃圾罢了。
    iamv2er
        54
    iamv2er  
       22 天前 via iPhone
    grok3 很强
    laikick
        55
    laikick  
       22 天前   ❤️ 1
    给老中打打鸡血就完事了 你还真用啊?
    cnrting
        56
    cnrting  
       22 天前 via iPhone
    grok3 最近是主力
    JoshTheLegend
        57
    JoshTheLegend  
       22 天前   ❤️ 15
    对啊,Sam Altman 就一傻逼,这么垃圾的东西还天天追着屁股又是喷又是上书懂王要求封杀,他要是提前问下你的意见估计就不会做这些小丑表演了。
    xuejianxianzun
        58
    xuejianxianzun  
       22 天前   ❤️ 1
    楼上挺有乐子的
    dodakt
        59
    dodakt  
       21 天前
    @cookii 试试新出的 gemini 2.5 pro
    me1onsoda
        60
    me1onsoda  
       21 天前
    r1 做离散数学题我觉得比 grok 好
    evan9527
        61
    evan9527  
       21 天前
    和哪吒的爆火异曲同工。
    crackidz
        62
    crackidz  
       21 天前
    @JoshTheLegend 你说的太对了,还有一个傻逼叫 Dario Amodei
    FlorentinoAriza
        63
    FlorentinoAriza  
       21 天前
    用时间长了 ds 感觉只能替代文心一言吧,浪费一大堆时间自说自话说一些没用的,最后给一个狗屁不通的方案,又加一大堆文本解释这狗屁不通的方案,用用就觉得火大,全靠自媒体博主带火的。主用 claude 和 gpt-o3 ,只有需要 sql 语句转换这类的用 ds 轻微辅助
    tabc2tgacd
        64
    tabc2tgacd  
       21 天前
    用得少,只是开始放出思维链时,有新鲜感,用了几次,仅有的那么几次还时不时的服务器忙,就没再用过了
    FlorentinoAriza
        65
    FlorentinoAriza  
       21 天前
    @wsbqdyhm #20 免费能给你用什么好动西,文字工作者首用 gpt4.5 专搞创作类,比其他模型强多了,编码免费 4o 之上有 o1 o3mini o3high 4o 都是远古模型了
    ramcasky
        66
    ramcasky  
       21 天前
    😰很难凭 我觉得 ds R1 已经完全可以覆盖日常开发基本诉求了
    cat9life
        67
    cat9life  
       21 天前
    没有尝试过 Grok ,看到 op 这帖子马上去试一下。一龙应该给你打钱😁
    ZColin
        68
    ZColin  
       21 天前
    Grok3 个人体验下来综合实力不错的,就是中文语言处理这块基本没什么适配
    sunny2580839896
        69
    sunny2580839896  
       21 天前
    国内 ai ,营销>实力
    yedkk
        70
    yedkk  
       21 天前
    我只用 sonnet 3.7 ,配合 windsurf ,这个模型是最强的,加上有命令行的能力。
    godspeedyou
        71
    godspeedyou  
       21 天前
    这是什么 grok 隐性广告贴么,“何德何能”都出来了,v2 对于 LLM 无论是技术还是应用的话题和讨论质量真的不太行
    MartinWu
        72
    MartinWu  
       21 天前
    借楼问问大佬,哪个智能体能比较好地实现塞给他一个 pdf 的接口文档,就能直接帮我写对接代码。主要是里面字段太多了,我懒得手敲。
    billly
        73
    billly  
       21 天前
    昨晚试了几个免费的,感觉最强的是 Gemini2.5 pro ,而且有很大的上下文
    dthghjhe
        74
    dthghjhe  
       21 天前   ❤️ 1
    不同情境下综合选择表现最好的模型才是正解
    lovedebug
        75
    lovedebug  
       21 天前   ❤️ 7
    真的不能理解一些人拉踩的嘴脸。。。
    我日常用 ChatGPT(包括 o3), gemini, grok, deepseek r1(api 充值),每家都有自己的特色,还是感谢 deepseek 真的拉下了 GPT 的限制,让 plus 用户享受更多。
    一般我解决问题会写一个常常的提示词,然后发给每个 ai 提供解决方案。
    gemini 很适合写文章,gpt 适合分析问题,deepseek 真的特别能懂我的需求,grok 适合找多个解决方案。
    lovedebug
        76
    lovedebug  
       21 天前
    @lovedebug 总结下,让 deepseek r1 分析需求,写出提示词,给其他 ai
    bli22ard
        77
    bli22ard  
       21 天前
    相反,我让写过使用 https://github.com/kubernetes/client-go 访问 k8s ,然后获取指定 pod 的日志,实现类似 tail -f 的功能,结果,Grok3 和 chatgpt 4o 和 ds 都写的有问题, 不过 ds 的最接近正确,chatgpt 4o 次之,然后 Grok3 给的代码 80%错误的
    batyu
        78
    batyu  
       21 天前
    DS 给出的答案,最好二次确认一遍。有些东西简直是现编的
    iv2ex
        79
    iv2ex  
       21 天前
    @billly #73 请问哪里可以体验`Gemini2.5 pro `。我看 `https://gemini.google.com/ ` 没有这个
    zxjxzj9
        80
    zxjxzj9  
       21 天前
    @DIO 虽然我也没觉得 claude 的会员很值得开,但是 claude 开不开会员区别特别大
    DinnyXu
        81
    DinnyXu  
       21 天前
    相同的问题,几个 AI 模型都问问,取长补短就可以了,一次对一次错代表不了什么,只不过在写代码方面,grok 我感觉还是强,可能是因为马斯克他们编程能力更出色? 但是涉及到一些我们本土化的语言表达,我认为 ds 很能懂的起,比如你可以尝试让他们起一个 LOL 的搞笑的昵称,ds 绝对能给你起很多梗,但是 grok 就做不到,所以你可以分为文科和理科的区别
    vipfts
        82
    vipfts  
       21 天前   ❤️ 1
    你的使用姿势对, ds 很差劲啊, 比 grok3 差远了, 所有问题试了上万次次都表现很差
    gaodq
        83
    gaodq  
       21 天前
    确实是这样的
    cxe2v
        84
    cxe2v  
       21 天前
    @dodakt 账号所在区域不支持付费
    ziyeziye
        85
    ziyeziye  
       21 天前
    只能说编程方面 ds 的确差点,还有就是上下文长度差了很多(编程问题和幻觉严重都受到这个影响),还有就是不支持多模态,其他的你想说有别的 ai 比 ds 强那是不可能的,其他都逻辑推理比 ds 差了不是一点
    wryyyyyyyyyyyy
        86
    wryyyyyyyyyyyy  
       21 天前
    @DIO 这个 qwen QWQ 在哪里可以用?自己没条件部署。
    ziyeziye
        87
    ziyeziye  
       21 天前
    @ziyeziye 其他 ai 只有 claude 真不错,编程 top ,逻辑能力除了 ds-r1 也比其他的强
    AlexHsu
        88
    AlexHsu  
       21 天前
    ds 的价值是 671b 开源 今年从过年回来到现在 我都部了两套了 但是都是 32b 的 去年政企还没啥需求呢
    能力上 别说 grok 了 比 gpt4o1 和 claude3.7 也没得比啊
    neptuno
        89
    neptuno  
       21 天前
    ds 的意义是训练成本低+开源。我一直不觉得它推理很强。
    InkStone
        90
    InkStone  
       21 天前
    @ziyeziye 这话应该反过来说才对,deepseek r1 只有逻辑推理这一个方面能达到较高水平,其它方面都是二流的……
    cxe2v
        91
    cxe2v  
       21 天前
    @YooboH 可能当年革命他家有些人被干掉了,所以仇恨家族传承下来了
    jurassic2long
        92
    jurassic2long  
       21 天前
    个人经验,DeepSeek 分析问题时最好看它的思维链,然后人工得出答案,经常遇到思维链分析思路非常正确,结论确实错误的情况。grok 用的少,也遇到过几次类似问题,grok 的思维链似乎比其他的要长不少,阅读思维链要花更多时间
    Moierby
        93
    Moierby  
       21 天前
    楼主先了解一下通用模型和推理模型的区别
    写代码应该用推理模型,deepseek 不擅长做这个
    dbaazz
        94
    dbaazz  
       21 天前
    @iv2ex #79 https://aistudio.google.com 这里可以使用谷歌全部的模型
    johnhuangemc2
        95
    johnhuangemc2  
       21 天前
    @lovedebug 我也觉得让 deepseek r1 根据自己的需求写出提示词质量特别高
    coolcoffee
        96
    coolcoffee  
       21 天前
    DS 给我的感觉就和 Google Gemini 差不多,跑分没输过,但是。。。

    不过它们还是有价值的,能把 openai 和 anthropic 牙膏管给挤爆。
    liangzaiyi
        97
    liangzaiyi  
       21 天前
    日常编程方面用 deepseek 和 grok 比较多,各有胜负。GPT 已经弃用了。deepseek 除了慢点和有时候服务崩,思考分析我觉得是最好的,常恨服务不给力。
    Wonz
        98
    Wonz  
       21 天前
    那就对了
    Promtheus
        99
    Promtheus  
       21 天前
    deepseek 好像是老外吹起来的。。
    ssb4
        100
    ssb4  
       21 天前   ❤️ 2
    deepseek 用户有几个拿他写代码?码农不要拿自己太当回事了
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   934 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 21:32 · PVG 05:32 · LAX 14:32 · JFK 17:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.