V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  neteroster  ›  全部回复第 4 页 / 共 43 页
回复总数  852
1  2  3  4  5  6  7  8  9  10 ... 43  
看起来这里的讨论还是有点意思的,我来抛几个砖:

> 原帖:就是 6500000 亿个连接。这要多少“参数”才能完整模拟。600B 的大模型的参数量也就这个数字的千分之一。所以...

这个论证并不明确。这些连接(条件)能达到某种效果不意味着达到某种效果需要这些条件。你当然大可以拿出所谓进化论去说一些道理,不过我仍然不认为这个论证是明确的。

> 所以说现在这种被称作 AI 的东西,根本没有智能

你可以说一下至少你自己对智能的定义吗?在没有共识的情况下讨论一个概念是没有任何建设性的。

进一步的,在明确了智能定义的情况下,你能比较严格的证明一个统计学模型(或者更准确地,一个由神经网络表示的语言模型( LM ))为什么永远不可能拥有“智能”吗?

---

个人观点:人类目前对意识、智能的概念了解甚少,以至于现阶段无法对大语言模型和类似人工智能系统的“本质”和“智能性”做任何形式的断言。
fc 我觉得 qwen 可能会比较好,因为他们最近几个系列模型都比较强调 agent 能力,看其他地方的不少实际测试也还可以(不过要注意聊天模板的配置)
232 天前
回复了 lyxxxh2 创建的主题 美国 美国 ai 禁令是真的吗?
从大部分信息源来看,“警告”( warn )是事实,但是没有提出新的规定。具体来说就是警告“使用华为 AI 芯片”违反出口管制规则;警告使用美国芯片训练中国 AI 的“潜在风险”。

https://www.google.com/search?q=US+issues+worldwide+restriction+on+using+Huawei+AI+chips&sourceid=chrome-mobile&ie=UTF-8
232 天前
回复了 lyxxxh2 创建的主题 美国 美国 ai 禁令是真的吗?
无所谓智能不智能,智能这玩意具体定义都没人能说个清楚。能用,好用,爱用就行(,我只关注怎么用比较好,以后会如何变得更好用
#1 说得对,视觉的话就 Gemma, Qwen VL 。另外你别给模型太长文本去翻译,要切分比较好。另外有条件还是直接 Gemini Flash 来着,一张图片就三四百 Token ,非常划算
245 天前
回复了 isbase 创建的主题 OpenAI Chatgpt Plus o3 被降智了
独享 IP 也不一定不降,最好是住宅 IP (所谓家宽)+ 同一个账号 IP 不频繁变化。号黑了的话换再好 IP 也没用了。

反正我不折腾,干脆不用。
现在做的好的也就 Gemini 的那个(模型必须要是 2.5Pro ),或者 OpenAI 那个(模型要是 o3 ,而且不降智)

总体来说 Gemini 那个体验更好,要买 Advanced
247 天前
回复了 ota 创建的主题 MacBook 从 win 到 mac 是不是每个程序员的必经之路?
虽然并不是(该说还不是吗)程序员,不过已经不使用任何苹果产品了(以前还用 iPad ),归根结底是个人越来越讨厌整家公司理念、营销策略,以及一部分粉丝群体。

#3
> 让苹果继续去卖它的黄金内存硬盘吧。
+1
248 天前
回复了 fjyhack007 创建的主题 OpenAI 求助: chatGpt Plus 有没有好用的合租平台
我能说现在不推荐吗,除非你折腾家宽 + 每天都自测有没有降智,不然就是活在白花钱的阴影中。
你说的对但是 +2000 左右我能更换到下面的内存/存储配置

https://i.imgur.com/reV7S2y.png

等什么时候 MacBook 能做到体验后再来评论(
255 天前
回复了 9yu 创建的主题 分享创造 我用 Rust 写了一个日漫汉化工具
@RedNax

已经有一些辅助的,比如
https://github.com/dmMaze/BallonsTranslator

多模态完全成熟之后也许可以全自动化
有可能,不过原因几乎都仅仅是供电能力和散热能力的差别。甚至说同一 GPU (例如 4060 ),不同笔记本可能会有不同的功率限制,这时候可以查看别人测试的芯片能效曲线确认。
258 天前
回复了 knowckx 创建的主题 编程 常用大模型编程项目得分排名 04-19
注意这是 WebArena ,仅限前端编程
非业界,只是对大模型有一定了解。

1. 很显然大模型不是所谓的“更高级”检索。大量例子表明 LLM 具有真正的泛化性,至少也是具有“通用模式匹配”的能力。

2. 很多人刚刚了解一点大模型的原理,就以 LLM 是“学习文本统计意义下的预测”这一点来否决 LLM 具有的泛化能力(他们通常还会辅以“LLM 具有幻觉”这一点作为例证)。LLM 是学习文本的统计学规律没错,但是我见过的任何一个持此类观点的人都无法陈述为什么学习统计学规律就无法产生真正意义下的“智能”(事实上,他们甚至无法准确地定义“智能”,就大谈“LLM 永远不可能有真正的智能”),LLM 会产生幻觉这一点也不蕴含 LLM 不能泛化,无法产生“智能”。

3. 与其关注“真正的智能”这种难以定义虚无缥缈的东西,还不如关注 LLM 能怎么用,缺乏什么能力阻止他变得更有用。我在这里得出的严重乃至本质上的需要克服的缺陷有两个:1. 无衰减的超长上下文 2. 持续学习(更新参数的那种)。只要解决这两点,大模型在实际生活生产中的应用可以大幅拓宽。甚至我觉得就凭现在先进的推理模型(比如 Gemini 2.5 Pro / o3 )加上上述两点就能实现非常接近 AGI 的存在。
264 天前
回复了 Fdyo 创建的主题 GitHub GitHub 网页版彻底崩了?
目前条件如下可复现

1. 大陆 IP ,无代理
2. 未登录情况(开无痕窗口)
#20 是对的,MoE 名字有些误导,实际上稀疏化才是目的和作用。并没有什么语义理解、问题拆分等模块。
280 天前
回复了 vagranth 创建的主题 奇思妙想 现在还有人需要“翻译 API 服务”吗?
这种不是很多,就算细分领域都一大堆了,比如日语游戏小说翻译:

https://github.com/NEKOparapa/AiNiee
https://github.com/neavo/LinguaGacha

还有提高翻译质量的译前自动术语表生成

https://github.com/neavo/KeywordGacha

更便捷的 gui 参数设置和 llama.cpp 启动器

https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI

甚至社区算力共享:
https://github.com/1PercentSync/sakura-share
1  2  3  4  5  6  7  8  9  10 ... 43  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2372 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 43ms · UTC 10:30 · PVG 18:30 · LAX 02:30 · JFK 05:30
♥ Do have faith in what you're doing.