首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
问与答
一个弱智的问题, hive 数仓的数据同步,如果源数据库里面的数据被修改了,那怎么办
zhxjdwh
·
2020 年 1 月 1 日
· 1948 次点击
这是一个创建于 2220 天前的主题,其中的信息可能已经有所发展或是发生改变。
如题:hive 数仓的数据同步,如果今天订单导入 hive 了,第二天用户又修改了订单信息,那怎么办?这样 hive 里面的数据就是脏数据了,这样的话,做分析统计 就跟实际的情况 就会有比较大的差异了
------
是不是还要一个数据更新的机制?这个一般是怎么处理的?
Hive
数据
订单
修改
3 条回复
•
2020-01-03 08:24:44 +08:00
1
laimailai
2020 年 1 月 2 日
我们是每天覆盖
2
laimailai
2020 年 1 月 2 日
还有个拉链表方案去看下
3
zhxjdwh
OP
2020 年 1 月 3 日 via Android
@
laimailai
谢谢,我了解一下
关于
·
帮助文档
·
自助推广系统
·
博客
·
API
·
FAQ
·
Solana
·
4466 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 282ms ·
UTC 10:01
·
PVG 18:01
·
LAX 02:01
·
JFK 05:01
♥ Do have faith in what you're doing.
❯