maolon's recent timeline updates
maolon
ONLINE

maolon

V2EX member #442547, joined on 2019-09-22 10:16:39 +08:00
Today's activity rank 955
maolon's recent replies
3 days ago
Replied to a topic by shoushen 奇思妙想 目前 agent 还是蓝海市场,机会很大
难点是解决长尾问题
也就是前 70%-80%问题他能轻松解决,
80%-95%也可以通过 harness 来解决,
难的是剩下那 5%的,你不知道用户从哪个旮旯角落里掏出来的的问题
是的输出变多了,速度也更快了,问题就是太贵了,他那个价格已经到了夸张的 $5 Input/$30 Output,
这个价格已经超过 opus 4.7 的 $5 I/$25 O 了
他要超不过 opus4.7 我反而有意见
done !👍👍👍👍
不认可 spec 说明他 p 都不懂, 不过毕竟他是你老板他给钱照他说的做就是了
codex 是法典的意思啊,一个完整的英文单词为什要拆开读
Apr 11
Replied to a topic by razios 问与答 大家觉得 gemini 和 gpt 哪个好用?
gemini 用一个词形容就是“戏精”,你让他分析问题很快就开始给你上情绪,什么“深刻的洞察”,“直击要害”,虽然上情绪没啥毛病毕竟舔用户讨喜,但是也连带着带歪他自己的分析。

gpt 情绪就少得多,而且感觉不说人话的原因是因为他回复的时候为了节省 token ,每句话永远少那么一两个字,什么“给这个方案一刀”,“我现在就断”之类摸不着头脑的中文。但是分析,执行能力还是不错的
不过现在分析问题最稳,合作水平最好的反而是 opus 。

agent 能力的话 gemini 更是灾难,有一个很反直觉的地方就是 gemini 的 pro agent 能力反而不如 flash ,gpt 就不用说了,agent 能力稳定的强。
Apr 10
Replied to a topic by fnd 分享创造 一个 AI 纯度百分百的网站(不吹)
虽然纯 ai 驱动没啥问题, 但是至少要他做质量检查? mj 和 cc 图都裂了我不知道用的人会怎么想
连 cursor 都不会用只会对着 gpt 网页 cv 那还叫 ai 工程师?楼上说的对,培训机构出来的
我觉得不是很妥,
1. 怎么算是事实? 观察,推断,需求,结果这些被塞在一起,agent 本身就很容易判断出错,一旦树的上层出现错误就会级联影响下层的结果
2. 虽然 agent 的编排基于事实自然生长看上去更优雅,但是没有解决复杂度的问题,只是把复杂度从谁命令谁变成了谁来定义事实,谁来做冲突解决,谁来撤回和重跑
3. llm 现在本身也不是为“事实治理”训练出来的,而是任务驱动的,基于事实治理的任务成功率存疑
4. 多 agent 至少目前不是版本答案,在很多问题 domain 里单 agent 系统( SAS ) ,效果并不差甚至是最优的选择,多 agent 一般在任务可拆解(上下文容易隔离),可探索,低耦合的任务上占优,所以也不是说什么任务都需要一个事实总线
5. 最后收敛条件是什么,谁来决定收敛(这也就是为什么 planner- excuter 被这么广泛的被使用的原因),没有这个系统会无限扩展下去


你确定你问对了 ai ?
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2494 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 01:08 · PVG 09:08 · LAX 18:08 · JFK 21:08
♥ Do have faith in what you're doing.