kennylam777

kennylam777

V2EX member #90581, joined on 2015-01-08 01:22:38 +08:00
Today's activity rank 14491
Per kennylam777's settings, the topics list is only visible after you sign in
Deals info, including closed deals, is not hidden
kennylam777's recent replies
這次更新太垃圾了, Flash 3.5 預設給你跑 Fast mode, 但 token 燒得倒水一樣快

更可惡的是還沒 GPT 5.5 Low 聰明

真的要考慮不續了, 我寧願把 Codex 升高一級
@songyoucai 不, 我在 Google IO 邊看 live 邊升級了, 然後 Antigravity IDE 按了也只是到 Agent only UI
我都要把 Antigravity uninstall 後才能裝回 Antigravity IDE 拿回 VS Code
API 及 AI studio 一直都有
7 days ago
Replied to a topic by randm Google Gemini gemini 昨夜悄悄更新了
@mh 之前 Family Share 不共享的, 但沒法子, 太便宜了

AG 共享後不知道 Gemini CLI 甚麼樣, 我的用法是先以 Gemini CLI 做計劃及設計 test, 再丟給 AG 的 Flash model 去做, Gemini CLI 的 Pro quota 一天 reset 一次, AG 的 Flash 則 5 小時一次能一直用到盡, USD 20 有這用量還是太便宜了
7 days ago
Replied to a topic by randm Google Gemini gemini 昨夜悄悄更新了
Reddit 上也有人討論 Flash 變強了

Antigravity 不更新的原因是我懷疑要一次過在 Google IO 跟新 model 一起推出來
@squarefong17 對, 即使是 DGX Spark 這些小機器, VRAM 足夠但跑 20B 以上的 Dense 模型都太慢, 唯一寄望是 Active 單位數字的 MoE

我本地用兩片 3090 + NVLink, 用 vllm 跑 Gemma4 31B FP8 打開 Tensor Parallel, 吃了 800W 電力才剛剛好有 60 tps
我也認為是 context 長度的問題而不是罵的問題, 一個 chat session 幹活太長會降智把之前做好的東西都改回, 愈小的模型愈有感, 畢竟小模型的注意力比較有限沒能像大模型般全都兼顧
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1002 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 19:02 · PVG 03:02 · LAX 12:02 · JFK 15:02
♥ Do have faith in what you're doing.