我用 Rust 写了一个最小原型来验证这个想法,取名 wgcDB 。
🧠 核心思路
- 数据按时间分成多个 微片( Micro-Shard ),每个微片是一个独立的目录
- 每个微片维护一个 动态表征池(其实就是轻量级索引)
-
系统统计查询频率,达到阈值后自动构建:
- 高频字段(如 user_id )→ 微型 B+ 树
- 低基数字段(如 category )→ 布隆过滤器
- 查询时,每个微片自动选择当前最优的表征
✨ 目前进展
🤔 为什么来 V2EX
在 Reddit 和 Hacker News 上被各种“新手限制”卡住了(账号太新、Karma 不够),折腾半天没发出去。听说 V2EX 对开发者比较友好,想来听听大家的建议:
- 这个方向有意思吗?
- 调度逻辑现在很粗糙(计数满 3 次就建),有什么更好的思路?
- 如果有兴趣一起玩,欢迎 PR 或提 issue
谢谢大家!