“Silver data”(银层数据):在数据湖/湖仓(Lakehouse)的“奖牌/分层(Medallion)架构”中,指经过清洗、去重、标准化与初步整合后的数据层,质量与一致性高于原始摄取的“Bronze data”,但通常仍未达到面向业务指标的最终“Gold data”。
/ˈsɪlvər ˈdeɪtə/
Silver data is cleaned and ready for analytics.
银层数据已经过清洗,可用于分析。
After deduplicating events and standardizing timestamps across regions, the team promoted the dataset to silver data for downstream modeling and reporting.
在对事件去重并统一各地区时间戳格式后,团队将该数据集提升为银层数据,以供下游建模与报表使用。
该说法源自用“金属等级”比喻数据成熟度的命名方式:Bronze(原始、杂质多)→ Silver(更干净、更可用)→ Gold(最精炼、面向业务产出)。其中“silver”强调“比原始更纯净,但仍可能需要进一步加工”。