maolon 最近的时间轴更新
maolon

maolon

V2EX 第 442547 号会员,加入于 2019-09-22 10:16:39 +08:00
今日活跃度排名 9587
maolon 最近回复了
不认可 spec 说明他 p 都不懂, 不过毕竟他是你老板他给钱照他说的做就是了
codex 是法典的意思啊,一个完整的英文单词为什要拆开读
2 天前
回复了 razios 创建的主题 问与答 大家觉得 gemini 和 gpt 哪个好用?
gemini 用一个词形容就是“戏精”,你让他分析问题很快就开始给你上情绪,什么“深刻的洞察”,“直击要害”,虽然上情绪没啥毛病毕竟舔用户讨喜,但是也连带着带歪他自己的分析。

gpt 情绪就少得多,而且感觉不说人话的原因是因为他回复的时候为了节省 token ,每句话永远少那么一两个字,什么“给这个方案一刀”,“我现在就断”之类摸不着头脑的中文。但是分析,执行能力还是不错的
不过现在分析问题最稳,合作水平最好的反而是 opus 。

agent 能力的话 gemini 更是灾难,有一个很反直觉的地方就是 gemini 的 pro agent 能力反而不如 flash ,gpt 就不用说了,agent 能力稳定的强。
3 天前
回复了 fnd 创建的主题 分享创造 一个 AI 纯度百分百的网站(不吹)
虽然纯 ai 驱动没啥问题, 但是至少要他做质量检查? mj 和 cc 图都裂了我不知道用的人会怎么想
连 cursor 都不会用只会对着 gpt 网页 cv 那还叫 ai 工程师?楼上说的对,培训机构出来的
我觉得不是很妥,
1. 怎么算是事实? 观察,推断,需求,结果这些被塞在一起,agent 本身就很容易判断出错,一旦树的上层出现错误就会级联影响下层的结果
2. 虽然 agent 的编排基于事实自然生长看上去更优雅,但是没有解决复杂度的问题,只是把复杂度从谁命令谁变成了谁来定义事实,谁来做冲突解决,谁来撤回和重跑
3. llm 现在本身也不是为“事实治理”训练出来的,而是任务驱动的,基于事实治理的任务成功率存疑
4. 多 agent 至少目前不是版本答案,在很多问题 domain 里单 agent 系统( SAS ) ,效果并不差甚至是最优的选择,多 agent 一般在任务可拆解(上下文容易隔离),可探索,低耦合的任务上占优,所以也不是说什么任务都需要一个事实总线
5. 最后收敛条件是什么,谁来决定收敛(这也就是为什么 planner- excuter 被这么广泛的被使用的原因),没有这个系统会无限扩展下去


你确定你问对了 ai ?
凡是觉得 agent 搞多一堆角色就好用实用任何场合都应该这么用的都应该去看看谷歌的论文 https://arxiv.org/abs/2512.08296
3 月 30 日
回复了 badboy200600 创建的主题 Apple 请问 m 芯片真的很强吗?
光看 gb6 单核(因为对于桌面端 gb6 多核没有什么参考性),
算你 i7 7700k,imac 上 1650 分,m5 的 gb6 是 4300 分,
理论跑分差不多高了 3 倍,更不要说编译实际也吃 io 速度,实际快个 5-8 倍甚至更高都应该不是什么问题
高楼必有傻逼,没想到 v2 也这样了,楼主这不挺好的分享,有些人看不惯就算了还输不起
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1164 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 23:20 · PVG 07:20 · LAX 16:20 · JFK 19:20
♥ Do have faith in what you're doing.