$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 stefwoo 打赏,数额会 100% 进入 stefwoo 的钱包。
 stefwoo 最近的时间轴更新
stefwoo
1.29D

stefwoo

V2EX 第 32465 号会员,加入于 2013-01-16 22:18:35 +08:00
今日活跃度排名 1630
stefwoo 最近回复了
10 小时 52 分钟前
回复了 Livid 创建的主题 Local LLM Qwen3.5-35B-A3B
@Jackyxiaoc https://pinchbench.com/
这个测评网站里面,这个模型跑龙虾还行,不过比 27B 要差五个百分点左右。

我的显卡是 3090 ,我现在就在犹豫是跑 27B 还是 35B ,27B 还是太慢了。
nullbr 挂了,没地方下载剧集电影。求一个邀请,c3RlZi53b28lNDBnbWFpbC5jb20= ,谢谢
@ada87

搞定了,谢谢你。我试一下,我觉得挺好的。有一个小问题,就是读 README 的时候,可以左右拖动。它在手机屏幕上应该不能左右拖动才好。
试了好多个都被对话了,也没回复😭,试了半天。op 私发一个给我吧😀🤙
5 天前
回复了 blueeon 创建的主题 程序员 为什么放弃了 RAG? RAG 的六大难题
就像 9 楼老哥问的一样,op 这个和 https://papers.voltropy.com/LCM 有什么区别。
我是在 openclaw 的插件: https://github.com/Martian-Engineering/lossless-claw 看到的这个东西。
系统将记忆分为不可变存储和活动上下文。所有原始消息都完整保存在不可变存储中,而发送给模型的仅是当前窗口(活动上下文)。
通过维护一个有向无环图( DAG ) 来管理摘要:旧消息被压缩成摘要节点,但始终保留指向原始数据的“无损指针”。模型可以通过 lcm_expand 等工具随时精准回溯任何原始信息,解决了 RAG 等方法的“失忆”问题。
MjA3MzEwNjVAcXEuY29t 已注册,试试看。
我其实也准备弄一个类似的应用,但我想的是把手机输入法输入的内容直接上屏到 Windows 。
9b 已经这么好了,我是 3090 回家跑个 Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled 看看怎样
7 天前
回复了 nativeBoy 创建的主题 程序员 roo code+deepseek,缓存命中很便宜!
@iorilu

缓存命中不是很简单吗?就是你第一轮对话的时候,会带上第一轮的数据。第二轮对话是带上第一轮和第二轮的数据。第三轮对话是带上前两轮的数据。然后你每次都会命中啊。相当于你每次发给他的就是增量的不太多,大部分都是对话的历史数据。
@yohole 你别说,我查了一下,还真是要好一些。😂
我现在用的 vivo X200 Pro ,我觉得是我用过最满意的手机了。
之前用过摩托罗拉、苹果、华为和小米
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3259 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 12:36 · PVG 20:36 · LAX 05:36 · JFK 08:36
♥ Do have faith in what you're doing.