V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zx900930
V2EX  ›  OpenAI

gpt 现在连基本的加法都不会算了

  •  
  •   zx900930 ·
    zx900930 · 306 天前 · 3950 次点击
    这是一个创建于 306 天前的主题,其中的信息可能已经有所发展或是发生改变。
    问题
    求和:20%
    15%
    10%
    10%
    10%
    10%
    5%
    5%
    5%
    5%
    5%
    5%
    5%
    5%

    GPT3.5 给的答案是总和等于
    0.2 + 0.15 + 0.1 + 0.1 + 0.1 + 0.1 + 0.05 + 0.05 + 0.05 + 0.05 + 0.05 + 0.05 + 0.05 + 0.05 + 0.05 = 1

    实际上心算一下就会发现是 1.15



    各位写报告的时候千万别太相信 gpt 算的数,文字可以直接抄,数据还是得 double check 一下。
    38 条回复    2024-02-07 22:03:34 +08:00
    FPL
        1
    FPL  
       306 天前 via iPhone
    GPT4 给的是 1.15 ,能用 4 就用 4 吧,3.5 和 4 还是有差距的
    zx900930
        2
    zx900930  
    OP
       306 天前
    @FPL #1 最基本的纯加法运算都会错这是我没想到的
    565656
        3
    565656  
       306 天前
    试了下,3.5 是直接输出的数字,4 是写 python 代码后计算
    ywkk
        4
    ywkk  
       306 天前
    作为一个人类,你看了这堆数字,能给出结果吗?将心比己。
    kulous
        5
    kulous  
       306 天前   ❤️ 2
    @ywkk 震惊
    TimePPT
        6
    TimePPT  
       306 天前
    @zx900930 很正常,本身计算就不是 GPT 的强项,所以 OpenAI 在 GPT4 加了个 analysis 功能,把计算交给外部工具去算
    wweerrgtc
        7
    wweerrgtc  
       306 天前   ❤️ 1
    Assistant 太菜了
    zx900930
        8
    zx900930  
    OP
       306 天前
    @ywkk #4 不是吧,这心算也花不了几秒时间吧,0.05*8+0.1*4+0.2 就已经是 1 了,然后再加 0.15 就是 1.15 。
    ervqq
        9
    ervqq  
       306 天前
    是的 我上次问过一次税额、不含税额的问题 也是一样 算出来是错的

    不含税价 = 16410 ÷ (1 + 0.06) ≈ 15462.26
    税额 = 16410 - 15462.26 ≈ 947.74
    min
        10
    min  
       306 天前
    为何要用 3.5
    june4
        11
    june4  
       306 天前
    将心比心,人也不能一眼看出来。
    目前的 ai 技术只是个成语接龙文字游戏,又不是真理解了问题,即使用了些蹩脚方式让有些部分转为传统精确计算也肯定是不全面的。
    fkname
        12
    fkname  
       306 天前
    这种问题不是一开始出来的时候就有吗,好像是因为它的回答是基于啥概率选择,所以后面引入了插件来解决这些问题
    PrinceofInj
        13
    PrinceofInj  
       306 天前
    其实我一直都好奇,GPT 知道自己在说什么吗?还是他仅仅是基于统计规律或者什么东西给出一些最高可能性的输出?实际上他根本不懂任何自己输出的东西。
    guxianbang
        14
    guxianbang  
       306 天前
    coze 是 4.0 吧?然而使用楼主的加法,每次结果都不一样,三次只有一次是正确答案。
    guxianbang
        15
    guxianbang  
       306 天前
    coze 清除之前对话记录后,再问就每次都是正确答案了。
    mxT52CRuqR6o5
        16
    mxT52CRuqR6o5  
       306 天前
    官方 chatgpt4 遇到算数问题会写一段程序然后在容器里执行得到结果
    FakerLeung
        17
    FakerLeung  
       306 天前
    3.5:
    这些百分比相加得到了多少呢?我来帮你计算一下。

    首先,我们将这些百分比转换为小数,然后相加起来。例如,20%可以表示为 0.20 ,15%可以表示为 0.15 ,以此类推。

    [ 20% = 0.20 ]
    [ 15% = 0.15 ]
    [ 10% = 0.10 ]
    [ 10% = 0.10 ]
    [ 10% = 0.10 ]
    [ 10% = 0.10 ]
    [ 5% = 0.05 ]
    [ 5% = 0.05 ]
    [ 5% = 0.05 ]
    [ 5% = 0.05 ]
    [ 5% = 0.05 ]
    [ 5% = 0.05 ]
    [ 5% = 0.05 ]

    现在,我们将它们相加:

    [ 0.20 + 0.15 + 0.10 + 0.10 + 0.10 + 0.10 + 0.05 + 0.05 + 0.05 + 0.05 + 0.05 + 0.05 + 0.05 = 1.00 ]

    所以,这些百分比相加的结果是 1 。
    johnsonwong
        18
    johnsonwong  
       306 天前
    darksheen
        19
    darksheen  
       306 天前
    试了下 gpt-4 的 API 也会算错,只有 chatgpt 调用外部 python 函数计算才能算对
    zqqian
        20
    zqqian  
       306 天前
    让它转换成 python ,用 python 算
    NnMmOo
        21
    NnMmOo  
       306 天前
    gpt4 算出来是 115%
    NnMmOo
        22
    NnMmOo  
       306 天前   ❤️ 1
    不是说什么,而是想说出了问题最好先找自身原因,3.5 既然是免费的那么就用更好的 4 ,目前 plus 的费用不存在用不起的状况
    bkmi
        23
    bkmi  
       306 天前   ❤️ 3
    了解什么是 GPT ( Generative Pre-Trained Transformer 生成式预训练 Transformer 模型),你就知道他擅长是理解和生成与输入相关的文本,而不是执行精确的数学运算。
    chancat
        24
    chancat  
       306 天前 via Android
    gpt4 是联网的
    chancat
        25
    chancat  
       306 天前 via Android
    那么我也可以认为,就是让数据不准备,你被迫充值 plus ,我这么说没人会反对吧
    ViolaH
        26
    ViolaH  
       306 天前 via iPhone
    gpt 数学就这样,调用 python 或者 wolfram 算就好了
    ViolaH
        27
    ViolaH  
       306 天前 via iPhone
    @chancat 也不算被迫,毕竟没人逼着用 OpenAI ,大语言模型一大堆
    ryd994
        28
    ryd994  
       306 天前
    记住,GPT 的训练目标是看起来一本正经,并没有真正的智能。正确答案当然看起来很合理,反过来就不一定,看起来很合理的答案未必正确。但是对的概率还挺高的。
    所以不要怪 GPT 一本正经的胡说八道,因为它的核心逻辑就是怎样胡说八道还看起来一本正经。

    不要把 GPT 当真理机器来用,GPT 最适合的工作是和人交互聊天,而不是处理逻辑。让 GPT 写文案就写得很好。
    fpk5
        29
    fpk5  
       306 天前
    @PrinceofInj #13 它就是不懂任何东西,他是个“语言模型”,类似鹦鹉。
    ophl
        30
    ophl  
       306 天前
    我问:字符串“192.168.100.23”的长度是多少?, 问多少次结果都是 12. 这是 3.5. 问 GPT4 ,就很准,而且解答很详细。
    nothingistrue
        31
    nothingistrue  
       306 天前
    @FakerLeung #17 你的 [ 5% = 0.05 ] 少数了一个。
    irave
        32
    irave  
       306 天前
    GPT4 文案也不会帮你好好写,加了提示词之后很多情况下都是偷懒给个大纲
    ywkk
        33
    ywkk  
       306 天前
    @fpk5 这是对大模型最大的误解,大模型确实懂东西,这和人的大脑一样,输入信息,输出信息,里面是个黑箱,而训练过程相当于构造这个黑箱内部的结构,你可以理解为一个极其复杂的立体迷宫,从入口处放一个小球(输入信息),小球在里面循着迷宫里极其复杂结构(推理过程),在某个出口处出来(输出信息),大脑也是一样的,不同的学习经历塑造了不同的神经回路,因此每个人对输入信息后的输出结果都不一样。
    fpk5
        34
    fpk5  
       305 天前
    @ywkk #33 动物大脑的工作原理都还没搞清呢,LLM 就不要去碰磁了。黑箱和黑箱也是不一样的。
    bravecarrot
        35
    bravecarrot  
       305 天前
    GPT 算数不太行的, 逻辑推理可以,计算得调插件 不然算不准
    3oq5kOT3OxK28MA9
        36
    3oq5kOT3OxK28MA9  
       302 天前
    可以试试我们的转发,感觉你这个不像是 4 呀

    ps:ChatGPT 中转服务: https://oneai.evanora.top/
    Zepp
        37
    Zepp  
       300 天前 via Android
    gpt 做计算类任务,最靠谱的方法还是描述需求让它写脚本,然后脚本算
    kaneg
        38
    kaneg  
       293 天前 via iPhone
    人类最聪明的大脑也没办法和几块钱的计算器比。 术业有专攻,我们需要人工智能的思考方式更像人,而不是更像计算器。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5534 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 08:01 · PVG 16:01 · LAX 00:01 · JFK 03:01
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.