合成数据:由算法或模型人工生成、而非直接从真实世界采集的数据,用于训练模型、测试系统、保护隐私或补充稀缺样本。(也常指“仿真/模拟生成的数据”)
/sɪnˈθɛtɪk ˈdeɪtə/
synthetic 来自希腊语 synthetikos(“组合、合成的”),与 *syn-*(“一起”)和 thesis(“放置、安排”)相关;data 源自拉丁语 datum(“给出的东西”),在现代英语中作为复数/集合名词使用很常见。合起来 synthetic data 字面意思就是“人为合成出来的数据”。
We used synthetic data to test the app before launch.
我们在上线前用合成数据测试了这个应用。
Because real patient records are sensitive, the team trained the model on synthetic data that preserves key statistical patterns without revealing identities.
由于真实病历很敏感,团队用能保留关键统计规律、但不暴露身份的合成数据来训练模型。