V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
teli
V2EX  ›  程序员

瞎扯大模型,文心一言和 kimi,应该押注哪一个?

  •  
  •   teli · 215 天前 · 7161 次点击
    这是一个创建于 215 天前的主题,其中的信息可能已经有所发展或是发生改变。
    只是瞎扯一下。
    因为没掏钱,文心一言最新版本的能力,我不知道。
    身边朋友认为 kimi 能力应该超过免费版的文心一言。
    国内其它模型用得不多,如果觉得应该押注其它模型,也不妨说说你的见解。
    押注哪一个,一方面考虑的是当下双方表现出来的能力,另一方面得做长远考虑(基础设施,一般都不愿意更换)。

    再瞎扯一句,是不是应该开个大模型版块?
    59 条回复    2024-05-19 16:03:07 +08:00
    GeekGao
        1
    GeekGao  
       215 天前   ❤️ 6
    押注能赢啥…股份还是现金
    dayeye2006199
        2
    dayeye2006199  
       215 天前 via Android   ❤️ 2
    阁下?…是巴菲特?
    Inn0Vat10n
        3
    Inn0Vat10n  
       215 天前
    deepseek
    zhiyu1998
        4
    zhiyu1998  
       215 天前 via Android
    @Inn0Vat10n #3 这个 api 确实便宜
    Semantic
        5
    Semantic  
       215 天前
    当然不能押宝百毒
    mumbler
        6
    mumbler  
       215 天前
    你都上 V 站了,当然用 chatgpt 啊,放着全球最好的不用,非要用山寨的
    yplam
        7
    yplam  
       215 天前 via Android
    @Inn0Vat10n 不知为何最近好多人推荐这个模型,我测试下来感觉效果也就 ChatGPT3.5 的水平
    crackidz
        8
    crackidz  
       215 天前   ❤️ 1
    为什么不是一键切换?为什么 vendor lock-in?
    daviswei
        9
    daviswei  
       215 天前
    不同模型训练到最后的表现应该都差不多,非要二选一的话我选文心。
    因为百度能接触的语料更多,它够不要脸,偷资源训练起来肆无忌惮。。。
    LPJD
        10
    LPJD  
       215 天前
    盲猜 kimi 接入了 Chatgpt ,同样的问题 kimi 和 chatgpt 回复的意思很接近。文心一言持续在胡说八道
    qinrui
        11
    qinrui  
       215 天前
    珍爱生命,远离百毒
    Meteora626
        12
    Meteora626  
       215 天前
    @yplam 因为他价格很便宜,3.5 的水平,价格可低于 3.5
    Meteora626
        13
    Meteora626  
       215 天前
    商业化还是文心
    NoobNoob030
        14
    NoobNoob030  
       215 天前
    国内我选千问,kimi > 文心
    BeijingBaby
        15
    BeijingBaby  
       215 天前
    kimi 没咋听说,背后的公司是?
    文心的背景是百度

    两个比的话应该看好百度旗下的一点吧
    whoosy
        16
    whoosy  
       215 天前
    kimi 比文心强的不是一点半点
    yaleax
        17
    yaleax  
       215 天前
    通义就挺好的,别的不用了。
    biglion666
        18
    biglion666  
       215 天前
    这俩都不咋地。。。国内选千问,deepseek ,01
    gavinzhou7
        19
    gavinzhou7  
       215 天前   ❤️ 3
    这两都不压。。
    国内,选清华系的智谱清言,阿里的通义千问 qwen 和零一万物的 Yi
    应用上 kimi 优势在长文本,有时也用用,广告打得猛
    Laimf
        20
    Laimf  
       215 天前
    kimi 挺好用的
    maolon
        21
    maolon  
       215 天前 via Android   ❤️ 1
    kimi 跟随人类指令的能力相当差,优势只在超长上下文。 文心没怎么用不评价。
    国内外一起算的话 qwen 应该是国产最强模型。yi 就一魔改 llama ,没啥前景。
    deepseek 还有待进一步观察他那个 MHL 是否在回答质量上优于 MHA
    rahuahua
        22
    rahuahua  
       215 天前
    如果只是调用 api ,也不存在啥押注
    ndd200
        23
    ndd200  
       215 天前   ❤️ 1
    经过各种对比,在某些时候对中文语义的理解,百度的要强于 GPT 。
    一些中文的问题,比如某些词语的解释,GPT 出错的概率比百度高。
    DigitaIOcean
        24
    DigitaIOcean  
       215 天前
    kimi 感觉免费/价格低 超长上下文
    文心一言 要收费 什么都有,比较全
    chatgpt 智商更高,贵
    itskingname
        25
    itskingname  
       214 天前
    如果你说对比通义千问和 kimi ,我还要真的考虑一下选谁。

    但是你说对比文心一言和 kimi ,那还考虑啥,百度做的工业垃圾有可比性吗?肯定选 kimi 啊。
    smalltong02
        26
    smalltong02  
       214 天前
    我蛮喜欢 Qwen 和 YI 模型的,它们为开源社区做出了很大贡献。
    feirisu
        27
    feirisu  
       214 天前
    代码都不行,经常调用某些类不存在的函数,也就早期 gpt3.5 的水平,中文理解可能略强一点
    haikea
        28
    haikea  
       214 天前
    好比押注中超谁夺冠........我看都不想看的比赛
    RealVic
        29
    RealVic  
       214 天前
    Kimi 上下文感觉一般,经常搞不懂我说的话,但是总结文章还挺好,支持读取微博、公众号连接。
    unco020511
        30
    unco020511  
       214 天前
    你说的押注是指啥?买相应公司的股票?还是作为公司 ai 业务的底层模型?也没什么压不压的,一般都会有个 AI 网关,会同时接入多个模型 API,网关可以无缝切换各个模型,与业务无关.

    要说好用,还得是 GPT
    cxk0
        31
    cxk0  
       214 天前
    他俩都比较弱。只是因为 Kimi 营销更胜一筹.
    百度真的没有营销人才吗? 营销部门是成本部门咯?
    redvoilin
        32
    redvoilin  
       214 天前
    文心一言最近没用过,不知道如何,kimi 最近用过,觉得挺垃圾的,完全营销出来的产品,过不了 1 、2 年可能就没了
    sriram
        33
    sriram  
       214 天前
    deepseek,有自研的超级 MOE,采购基建项目便宜一定是压倒性的
    CodeCodeStudy
        34
    CodeCodeStudy  
       214 天前
    智谱清言和百川大模型的比较好
    janus77
        35
    janus77  
       214 天前
    什么意思,你不能两个都押?
    enderftt
        36
    enderftt  
       214 天前
    我押海螺 ai
    houzhiqiang
        37
    houzhiqiang  
       214 天前
    我选 deepseek
    W4J1e
        38
    W4J1e  
       214 天前
    看到它这么回答,我仿佛是在用初代的文心一言和 chatGPT:
    我:你怎么翻译“是故学然后知不足,教然后知困”
    Kimi:"这句话出自中国古代思想家孔子的《论语》,原文是“是故学然后知不足,教然后知困”。这句话的意思是:通过学习,我们才能意识到自己的不足;通过教导他人,我们才能发现自己理解上的局限。"
    PbCopy111
        39
    PbCopy111  
       214 天前
    压智谱吧。
    googlefans
        40
    googlefans  
       214 天前
    现在国内好用的是阿里的千问,其他都不行,开始智谱还可以,最近被千问超过了。国内的我一直用千问。感觉对于处理中文还是需要国内的模型,国外的无疑 gpt 了
    teli
        41
    teli  
    OP
       214 天前
    @googlefans llama3 之类国外开源模型被中文微调过后呢?
    NerbraskaGuy
        42
    NerbraskaGuy  
       214 天前
    kimi 的读文档能力很强啊,我感觉这方面比通义千问和文心一言强点。
    looveh
        43
    looveh  
       214 天前
    智普、通义千问都比它好用吧
    looveh
        44
    looveh  
       214 天前
    @teli llama3 70B 还行,8B 不行
    yinmin
        45
    yinmin  
       214 天前
    通义千问 QWEN-1.5-110B(开源)、零一万物 yi-large 应该都比 kimi 强。国内 AI 大模型,我看好阿里的通义千问。
    monkeylmj
        46
    monkeylmj  
       214 天前 via iPhone
    文心一言就是个垃圾,胡说八道的。 百度这公司就不行,用过豆包,通义,同一个问题只有文心一言在胡说八道
    amon
        47
    amon  
       214 天前
    百度吧,毕竟苹果和 Tesla 都要接入这个,国产大模型最根红苗正的。
    selamet
        48
    selamet  
       214 天前
    有人用字节的“豆包”吗,感觉也比文心一言强。
    gransh
        49
    gransh  
       214 天前
    选狗都别选百度
    emartcn
        50
    emartcn  
       214 天前
    @daviswei

    这个思路不错,想用哪个用哪个,是 ai.iyou.city 这样的吗?
    iyaozhen
        51
    iyaozhen  
       214 天前
    @Meteora626 说便宜 有 doubao-pro 便宜嘛,可以试试 逼近 4.0
    xguanren
        52
    xguanren  
       214 天前
    话说哪个知识库比较新啊 现在用的 kimi 的 他好像有联网能搜 有时候写 go 但是 go 版本更新有点快 gpt4 也试了 知识库好像就在 1.8 的时候
    zhangzEric
        53
    zhangzEric  
       213 天前 via iPhone   ❤️ 1
    @xguanren 写代码可以试试这个:devv.ai

    每天都在高频使用,体感上挺好用的
    cutchop
        54
    cutchop  
       213 天前
    不用百度我们还是朋友
    BlackSiao
        55
    BlackSiao  
       213 天前
    啥叫押注啊?哥们说的像股神一样
    krystalbar
        56
    krystalbar  
       213 天前
    讯飞星火也可以试试
    macaodoll
        57
    macaodoll  
       213 天前 via Android
    文心 4.0 8k 版本 API 接入,测试了 800 条,每条耗时 30-60 秒,然后某些关键词黑名单完全无解,最终结果就是生产环境根本用不起来,还是外面的香,同样的 800 条平均 10-15 秒。
    rebecca554owen
        58
    rebecca554owen  
       212 天前
    @macaodoll 我用国内的 AI 就是遇到 docker run 运行 xray(r)转成 docker compose 这种简单互转,回答了快结束就不见了。
    thevita
        59
    thevita  
       212 天前
    为啥要押注,对你来说,路线之间存在资源竞争才需要押注,将来不好说,但现在显然你在一方的投入不存在完全不能用到另一方的情况
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5759 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 01:51 · PVG 09:51 · LAX 17:51 · JFK 20:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.