我的使用姿势不对么, 我感觉 ds 很差劲啊, 比 grok3 差远了, 编程相关问题试了几次都表现很差

使用姿势

ds

Grok3

164 条回复 • 2025-03-29 10:15:35 +08:00

1 2

❮

❯

1

honkew

271 天前

那就对了

2

willchen

271 天前

那就对了

3

whoosy

271 天前

新版本的确实感觉有问题

4

DIO

271 天前

1

ds 何德何能和 grok 比，现在中文 qwen QWQ ，英文 Grok 基本是我这个穷鬼的标准答案了。虽然订阅了 chatgpt 但是这两个月很少动用了。ds 用来平替百度还可以。claude 没开会员，不知道付费版体验怎么样。

5

windyboy

271 天前

3

唯一可以指责你的是政治不正确

6

jdz

OP

271 天前

2

@DIO 我也感觉, 感觉铺天盖地吹捧 ds, 试水了几次都被劝退了

7

Donaldo

271 天前

最近写 CUDA ，grok3 是唯一能写对的，其他像 o1,o3-mini-high,claude-3.7(或 thinking),r1,gemini-pro(或 flash-thinking)都不行。

8

MRG0

271 天前

我无法触发他的第二次回答

9

javazero

271 天前

马斯克实在给的太多了，ChatGPT plus 停了。主力直接用 grok 3 免费而且量大管饱

10

zbw0414

271 天前

@DIO ds 幻觉那么严重各种瞎编, 你居然让他平替百度.....
真平替还是 perplexity 吧. 搜索真的接受不了幻觉.

11

jdz

OP

271 天前

@javazero 虽然免费, 但是感觉质量挺好的

12

bronyakaka

271 天前

gro3k 本来就是目前最强的，差点很正常。

13

lzgshsj

271 天前

39

我代码主力 claude 的，前两天写了两个 awk 脚本，claude 3.7s 完全不对，ds r1 思考了 7 分钟，完美符合要求

只能说每个人遇到的问题都千奇百怪，哪怕是同一家 AI 也不是每次答案都一样。
同样问题，你问出来不对，我问出来对了。刚才问的不对，现在问对了……只能说不要只看一家，平时也可以多换着问问。

14

zbw0414

271 天前

20

@jdz 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费

15

dapang1221

271 天前

我现在日常琐事问题 deepseek R1 ，需要创意及比较新颖的问题 grok ，写逻辑代码 claude 3.7 ，生成前端 UI deepseek R1 或 V3

16

ahdw

271 天前

@zbw0414
> 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费

太赞同了。主要就是因为没有使用门槛，而且背后的「浙江六小龙」都在宣传和公关方面投入了很多，让 DeepSeek 充分曝光了。

为我自己的这篇文章引流： https://kutt.it/Z4bAtw

17

youthfire

271 天前 via iPhone

claude3.7 thinking 稳稳第一，grok3 第二，其他都是玩具

18

NoOneNoBody

271 天前

ds 有个最奇怪的现象是在其他 ai 没见过的，回答代码居然会漏一边括号这种低级错误
代码质量我觉得过得去，比 copilot 和 genmini 好，gpt 就暂时判断不出哪个更佳，当然说的都只是免费 web 之间比较

19

qinxs

271 天前 via Android

3

对大多数普通人来说 deepseek 已经够用了

编程领域我提出的问题 ds 也能完美解决 80%以上

最后马化腾财富全球排名 36 所以他很穷！！

20

wsbqdyhm

271 天前 via iPhone

文字工作者，深度使用，感觉 grok3 和阿里新出那个差不多，ds 在这两个之后，ds 比 chatgpt 好，gpt 降智太弱了，我说的都是免费版

21

Cloud9527

271 天前

最近再用 qwq-plus 感觉还可以,主要是吐字快!

22

evilStart

271 天前

14

deepseek 不行为什么美国人这么害怕？这么讨厌国产的还是 run 吧，在这里苦了你们了

23

kyor0

271 天前

5

只拿小红分滚出这个论坛

24

looplj

271 天前

4

llm 都不是很稳，不能因为单一场景，单次使用有点问题，就否定整个模型。。

25

Donaldo

271 天前

@ZSeptember #24 评论区完美体现了你这个观点，大家针对不同使用场景，分别对不同模型进行了赞扬和批判～

26

iamsad3508

271 天前

温度调到 0 ，再试

27

takanashisakura

271 天前

@zbw0414 #14 qwq-plus 也不用翻墙

28

9ki

271 天前

这个月高强度用 ai 学习，claude 3.7 （ Thinking ）/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队，grok3 ，gpt-4.5 o1-mini 纯纯路边

我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来，像二楼那种 claude 都没用过，不知道哪来的自信参与讨论

29

Stunt4013

271 天前

@Donaldo 刚出的 gemini 2.5 pro 也很强

30

EricYuan1

271 天前

别的不说，手机 app ，这几个中 grok 做的最好看

31

qiaobeier

271 天前

通用的 deepseek （翻译，帮小孩写作文，润色文档，甚至还做过 WEB 项目配色方案等等，结果都很优秀）。写代码只使用 claude 。有买 GTP 但基本不用了。

32

lscho

271 天前

因为 ai 覆盖的场景太广泛，所以看测试就行。只有测试才能尽可能覆盖大部分场景。

单一场景谁都有可能出错

33

4eympe94CsqJ7Y39

271 天前

grok3 确实能打

34

k9982874

271 天前 via Android

先不说质量，输出速度 ds 是最慢的。。。

35

fancy2020

271 天前

百度和 Google 的区别

36

clino

271 天前

我其实是从 deepseek v2 开始用的，当时就感觉很好用，切成 v3 以后好像没有明显更好的感觉
当然我没怎么用过 claude 所以没有明显对比，但是 deepseek 一直给我感觉是相当好了

37

cookii

271 天前 via Android

体感 grok 确实很好用，比其他都强

38

zhwguest

271 天前

刚开始出来其实感觉很不错，但是后来慢慢觉得越来越不那么惊艳了...

39

LittleYangYang

271 天前

deepseek 我从 v2 开始用它去处理数据，当时主要是相比其他家太便宜了，效果还好，这价格很难让人拒绝()，就是并发非常低
新的 R1 主要强在它的强化学习策略，落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的，说的话非常似人，比其他模型更像贴吧老哥，但是编数据的幻觉倾向也很厉害，也有丢上下文的倾向，很多生成结果基本上义眼就能看出来是 deepseek 写的。
最近我在信息抽取工作上比较了几个模型，在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右，json 格式化约束的稳定度倒是还挺好。
其他的模型实际用起来其实感觉 grok3 幻觉也严重，gemini deepresearch 是真好用啊，谷歌的信息来源还是太猛，开了 gemini advanced ，下个月想把 gpt plus 关掉了，o3 真废物....

40

wweerrgtc

271 天前

@lzgshsj #13 思考 7 分钟也太慢了吧, 有没有问答链接可以看看呀

41

seven777

271 天前

它本来就很差，从没象吹的那么优秀过。
我真心佩服的就 Claude ，Grok

42

docx

271 天前 via iPhone

编程用 Claude Sonnet

43

Yuanlaoer

271 天前

我记得最常见的一句评论是：
deepseek 的逻辑推理能力很强
我当年参加物理竞赛和辩论赛的时候，都不知道原来有这么多深耕逻辑学的人士深藏网络

44

MYDB

271 天前

都不好用，一个问题多问几家，然后选择自己认为是正确的答案，也不排除都不对，一些小众领域还是不适合 ai

45

YooboH

271 天前

14

从我个人体验来看，ds 中文回复质量比免费的 4o 和 gemini 要好上不少，我写论文有时遇到复杂的问题他都能够给不错的参考回复。不过他指令依从性不太好，很容易发散，需要自己注意限制。付费版的 chatgpt 很久没有续费了就没资格评价了。
另外，光是他坚持开源权重这一点就让我没有任何理由批评他了，所谓的什么营销和这一点相比算的了什么。楼里的某些人的回复可真是让人大开眼界，国产是多大仇啊

46

skiy

271 天前

不好用就别用了吧。这样它就不要总是“服务器不可用”了。
刚刚提交了个提问，还不错。而同个问题，ChatGPT 只给出文字描述，必没有给代码。DeepSeek 给出代码实例了。
自从之前一直给“服务器不可用”，就很长时间不用了，改用 Kimi 。今天回来用，居然可用。不错不错。

代码这个，一般情况都是要多个平台提问，再综合答案得出自己的解决方案。没有哪个是最好的。ChatGPT 相对来说，Shell 给的非常不错，但有时要使用 Kimi 补充。Grok 有限额，DeepSearch 有时会不可用。其它的比如 ChatGPT 和 Gemini 也一样情形。

47

BelovedOne

271 天前

目前来说 Grok 体验最好，非常的专业，效率也很高，思考和搜索的过程非常干练。ChatGPT 也很棒，不过结果总是略逊一筹。

48

rpish

271 天前

op 用的 v3 还是 r1 ？
话说 grok3 刚发布不久，r1 发布 2 个多月了，按照大模型半年一代的迭代周期，有差距也很正常。

49

wwhc

271 天前

1

在开源模型中 DeepSeek 和 Qwen 是目前最好的，自建成本也并不是高不可攀，我觉得没有责难的理由，那些闭源模型没有匹配的可能性

50

elone

271 天前

我今天写一个较为复杂点的 swiftui 的代码, 最终用下来只有 grok3 帮我把代码写出来了, 对比了 ds, 还用了最新的 gemini 2.5, 都完全跑不起来. 只有 grok3 最终实现了, 而且, 代码风格居然很贴合我的习惯.

51

jdz

OP

271 天前 via Android

@rpish 最新的 v3

52

NanFengxuan

271 天前 via iPhone

DeepSeek 就是一坨，让它写一段 matlab 代码结果死机了，一直重复输出一个字母

53

Meursau1T

271 天前

2

@zbw0414 ds 有幻觉没错，但是你推荐 perplexity 就不对了，这东西还不如 ds 和 qwen 呢，而且注水非常严重，印度人搞的垃圾罢了。

54

iamv2er

271 天前 via iPhone

grok3 很强

55

laikicka

271 天前

1

给老中打打鸡血就完事了你还真用啊?

56

cnrting

271 天前 via iPhone

grok3 最近是主力

57

JoshTheLegend

271 天前

15

对啊，Sam Altman 就一傻逼，这么垃圾的东西还天天追着屁股又是喷又是上书懂王要求封杀，他要是提前问下你的意见估计就不会做这些小丑表演了。

58

xuejianxianzun

271 天前

1

楼上挺有乐子的

59

dodakt

271 天前

@cookii 试试新出的 gemini 2.5 pro

60

me1onsoda

271 天前

r1 做离散数学题我觉得比 grok 好

61

evan9527

271 天前

和哪吒的爆火异曲同工。

62

crackidz

271 天前

@JoshTheLegend 你说的太对了，还有一个傻逼叫 Dario Amodei

63

4UyQY0ETgHMs77X8

271 天前

用时间长了 ds 感觉只能替代文心一言吧，浪费一大堆时间自说自话说一些没用的，最后给一个狗屁不通的方案，又加一大堆文本解释这狗屁不通的方案，用用就觉得火大，全靠自媒体博主带火的。主用 claude 和 gpt-o3 ，只有需要 sql 语句转换这类的用 ds 轻微辅助

64

tabc2tgacd

271 天前

用得少，只是开始放出思维链时，有新鲜感，用了几次，仅有的那么几次还时不时的服务器忙，就没再用过了

65

4UyQY0ETgHMs77X8

271 天前

@wsbqdyhm #20 免费能给你用什么好动西，文字工作者首用 gpt4.5 专搞创作类，比其他模型强多了，编码免费 4o 之上有 o1 o3mini o3high 4o 都是远古模型了

66

ramcasky

271 天前

😰很难凭我觉得 ds R1 已经完全可以覆盖日常开发基本诉求了

67

cat9life

271 天前

没有尝试过 Grok ，看到 op 这帖子马上去试一下。一龙应该给你打钱😁

68

ZColin

271 天前

Grok3 个人体验下来综合实力不错的，就是中文语言处理这块基本没什么适配

69

sunny2580839896

271 天前

国内 ai ，营销>实力

70

yedkk

271 天前

我只用 sonnet 3.7 ，配合 windsurf ，这个模型是最强的，加上有命令行的能力。

71

godspeedyou

271 天前

这是什么 grok 隐性广告贴么，“何德何能”都出来了，v2 对于 LLM 无论是技术还是应用的话题和讨论质量真的不太行

72

MartinWu

271 天前

借楼问问大佬，哪个智能体能比较好地实现塞给他一个 pdf 的接口文档，就能直接帮我写对接代码。主要是里面字段太多了，我懒得手敲。

73

billly

271 天前

昨晚试了几个免费的，感觉最强的是 Gemini2.5 pro ，而且有很大的上下文

74

undefinedBoy

271 天前

1

不同情境下综合选择表现最好的模型才是正解

75

lovedebug

271 天前

7

真的不能理解一些人拉踩的嘴脸。。。
我日常用 ChatGPT(包括 o3), gemini, grok, deepseek r1(api 充值)，每家都有自己的特色，还是感谢 deepseek 真的拉下了 GPT 的限制，让 plus 用户享受更多。
一般我解决问题会写一个常常的提示词，然后发给每个 ai 提供解决方案。
gemini 很适合写文章，gpt 适合分析问题，deepseek 真的特别能懂我的需求，grok 适合找多个解决方案。

76

lovedebug

271 天前

@lovedebug 总结下，让 deepseek r1 分析需求，写出提示词，给其他 ai

77

bli22ard

271 天前

相反，我让写过使用 https://github.com/kubernetes/client-go 访问 k8s ，然后获取指定 pod 的日志，实现类似 tail -f 的功能，结果，Grok3 和 chatgpt 4o 和 ds 都写的有问题，不过 ds 的最接近正确，chatgpt 4o 次之，然后 Grok3 给的代码 80%错误的

78

batyu

271 天前

DS 给出的答案，最好二次确认一遍。有些东西简直是现编的

79

iv2ex

271 天前

@billly #73 请问哪里可以体验`Gemini2.5 pro `。我看 `https://gemini.google.com/ ` 没有这个

80

zxjxzj9

271 天前

@DIO 虽然我也没觉得 claude 的会员很值得开，但是 claude 开不开会员区别特别大

81

DinnyXu

271 天前

相同的问题，几个 AI 模型都问问，取长补短就可以了，一次对一次错代表不了什么，只不过在写代码方面，grok 我感觉还是强，可能是因为马斯克他们编程能力更出色？但是涉及到一些我们本土化的语言表达，我认为 ds 很能懂的起，比如你可以尝试让他们起一个 LOL 的搞笑的昵称，ds 绝对能给你起很多梗，但是 grok 就做不到，所以你可以分为文科和理科的区别