V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  locoz  ›  全部回复第 20 页 / 共 324 页
回复总数  6480
1 ... 16  17  18  19  20  21  22  23  24  25 ... 324  
@matrix1010 #22 你把事情想复杂了,自己去搜索、根据搜索到的页面内容进行归纳总结和找到需要的信息、自己添加日志进行 debug 、自动调用命令行、自动通过特定方式部署程序等模拟人机交互的事情,都是只需要做好操作接口,并且在 prompt 中告诉语言模型可以这么做,就能轻松做到的事情,这方面反而是这整个产品中最简单、最没有门槛的。

因为做到这些事情的核心在于决策能力,而决策能力来源于语言模型,像 GPT4 、Claude2 这种头部级别的大语言模型本身就具备做出这种决策的能力,并且之前出现过的很多让 AI 进行自动化操作的产品都是这么做的,包括 ChatGPT 上的插件功能本质上也就是这么做的。
@matrix1010 #19 小公司没有任何 [自己训练一个能跟 GPT4 之类头部级别的模型 PK 的模型] 的可能性,所以为了效果好只能是基于 GPT4 或者 Claude2/3 这种头部的大模型来实现,否则模型的基础能力差会导致很多问题完全解决不了。

另外,新智元 介绍 Devin 的文章最后有提到:“CEO Wu 并没有详细说明他们的智能体背后使用的 AI 技术,只是笼统地解释说,团队找到了将大语言模型(例如 OpenAI 的 GPT-4 )与强化学习技术相结合的独特方法。”,很显然也只能是行业头部的大模型了。

效果方面我觉得没什么好对比的,根据官方的说法和演示视频中的效果来看,大概率是加了个提取关键信息的模型,代替了人提取关键信息给 AI 的步骤,做到在使用尽可能压缩上下文的情况下丰富信息量,自动化地让 AI 在输入信息密度极高的情况下输出东西,这效果当然会比上下文长度受限、可输入信息不全的情况下只能直接丢问题给 AI 的情况要好。

但其实随着像 Claude 3 这种支持更长上下文的模型进一步发展,未来完全可以在不需要那么精细地提取关键信息的情况下让 AI 得到所需的所有信息,哪些文件相关那就直接把文件都丢给 AI 就行了。在这个前提下,Devin 做的这种优化其实优势是会越来越小的。
@pixelbook #11 在决策层被 AI 取代之前,底下干活的早就被取代完了。决策层最核心的能力之一就是想法要具有前瞻性、能看透一个甚至多个行业找到最合适的路线,指望靠着以大众发布的内容为主的数据去训练出一个能站在更高的角度看问题的 AI ,在当下属于是做梦。当下这种训练方式能做到的 AI 仅限于把客观的信息概括出来,在没有人去引导的情况下是完全做不到跨多行业“思考”出能称得上是“决策”的东西的。
@matrix1010 #8 不至于的,都是依赖别人的模型实现的效果,在用的模型一致的情况下做不到多大的能力差距。
有些类型的问题,当下的语言模型搞不定就是搞不定,哪怕是人专门去精选输入内容和调整 prompt 都很难搞定,这是模型基本能力的问题,再优化也解决不了。
决策能力方面看起来是模型的问题,可以试试在用 Claude 3 的情况下能达到什么程度,我现在让 AI 改代码、加功能都是几个文件直接丢过去了,可工作的上下文长度长带来的效果极其明显。
飞书也有搞这些,还请人做了好多软广。但说到底这种功能实现起来都很简单,核心问题还是数据安全和隐私问题,解决不了这个问题就永远没法推广起来,这不是说不考虑就能不考虑的…
285 天前
回复了 nullo 创建的主题 宽带症候群 代理服务器
@nullo #9 那你可以选择用 v2ray 之类的解决问题
286 天前
回复了 yz346287786 创建的主题 分享发现 关于 XR 设备,你怎么看?
Apple Vision Pro 主要贵在更好的屏幕、更好的透镜、更好的芯片、更多的传感器,以及没多大实用意义的铝合金外壳、前屏幕模块这种东西。

市场目前主要是没有办法让人愿意日常使用,所以起不来。但后面一段时间会出来的比如 Immersed 搞的眼镜式头显,说是跟 Apple Vision Pro 一样的屏幕,如果它体验做得可以,那拿来日常办公还是很好的,外观好看、轻便、不强依赖电脑、该有的主要功能都有,完全能满足日常使用的需求。
@siweipancc #10 AI:我好委屈,你又没跟我说要这样,我怎么知道你要什么。
@mandex #7 语言模型对数字和一些抽象的东西没概念不代表它不能借助其他东西完成需求,像你这个需求只要允许它用代码先计算再把结果输出,它就能输出绝对正确的值。这种问题你就算给人做,人也得借助工具去计算一下才能确保结果没问题...

让语言模型写代码,完全可以只是把需求讲清楚,它写完程序自己再写测试,确保代码层面没问题、能满足需求之后直接把成品给人验证就行了,人是可以不需要去看代码的。当下无非就是成本问题不适合这么做而已,真要做的话还是可以做的。
286 天前
回复了 nullo 创建的主题 宽带症候群 代理服务器
简单的代理用 tinyproxy 、squid 之类的都可以,简单配置一下就能用。复杂情况可以用常见用于翻墙那些东西,shadowsocks 、v2ray 之类的。
1 ... 16  17  18  19  20  21  22  23  24  25 ... 324  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5513 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 58ms · UTC 08:20 · PVG 16:20 · LAX 00:20 · JFK 03:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.