咨询个 hbase 的订单路由问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 1693 天前的主题，其中的信息可能已经有所发展或是发生改变。

假设某个公司的订单 10 年达到 100 个亿的数据，存在 hbase 里面
1.创建一张表，散列到 100 个分区，rowkey 是按照 userid 进行散列
2.创建 10 张表，每个表有 10 个分区，这 10 个表是按照订单的创建时间每年来划分的，rowkey 是按照 userid 进行散列

如果用方案 1，那么这张表会不会显得大，因为最近一年的订单访问会比较频繁，一年前的数据访问不那么频繁，有没有那种浪费的感觉

如果用方案 2，最近一年那个表会不会出现热点问题，可以把一年前的订单用机械磁盘存，最近一年用 ssd 存储，保证 99rt，且降低成本

目前存在的疑惑就是方案 2 会不会出现热点问题，因为方案 1 的话，感觉会路由到不同的分区，会减少热点的概率

对 hbase 还不是太熟悉，求指教一下

目前尚无回复

Hbase 散列订单 rowkey