@
matrix1010 #19 小公司没有任何 [自己训练一个能跟 GPT4 之类头部级别的模型 PK 的模型] 的可能性,所以为了效果好只能是基于 GPT4 或者 Claude2/3 这种头部的大模型来实现,否则模型的基础能力差会导致很多问题完全解决不了。
另外,新智元 介绍 Devin 的文章最后有提到:“CEO Wu 并没有详细说明他们的智能体背后使用的 AI 技术,只是笼统地解释说,团队找到了将大语言模型(例如 OpenAI 的 GPT-4 )与强化学习技术相结合的独特方法。”,很显然也只能是行业头部的大模型了。
效果方面我觉得没什么好对比的,根据官方的说法和演示视频中的效果来看,大概率是加了个提取关键信息的模型,代替了人提取关键信息给 AI 的步骤,做到在使用尽可能压缩上下文的情况下丰富信息量,自动化地让 AI 在输入信息密度极高的情况下输出东西,这效果当然会比上下文长度受限、可输入信息不全的情况下只能直接丢问题给 AI 的情况要好。
但其实随着像 Claude 3 这种支持更长上下文的模型进一步发展,未来完全可以在不需要那么精细地提取关键信息的情况下让 AI 得到所需的所有信息,哪些文件相关那就直接把文件都丢给 AI 就行了。在这个前提下,Devin 做的这种优化其实优势是会越来越小的。