“写入时建模/写入时定义模式”:一种数据管理方式,在数据写入存储之前就先定义并强制执行数据结构(schema),通常需要在导入时做清洗、校验与转换;常见于传统数据仓库与严格的ETL流程。(也常与 schema-on-read “读取时建模”对比。)
/ˈskiːmə ɒn raɪt/
We use schema-on-write to keep reporting data consistent.
我们使用“写入时建模”来保持报表数据的一致性。
In a schema-on-write pipeline, raw events are validated and transformed during ingestion, so downstream analysts query a stable, well-defined table structure.
在“写入时建模”的流水线中,原始事件在导入时就会被校验与转换,因此下游分析师查询的是结构稳定、定义清晰的表。
该术语由 schema(“模式/结构”,源自希腊语 skhēma,意为“形态、框架”)+ on(“在……时”)+ write(“写入”)组合而成,字面意思就是“在写入时应用模式”。它在数据工程语境中用来强调:数据进入系统前就要符合预先设计的结构与规则。