“Distribution shift”(分布偏移/分布漂移)指训练数据与实际使用(测试/部署)时的数据在统计分布上不一致,导致模型在真实场景中性能下降的现象。(常见于机器学习与数据科学;相关概念还包括 covariate shift、concept drift 等。)
/ˌdɪstrɪˈbjuːʃən ʃɪft/
The model failed because of distribution shift.
这个模型失败是因为出现了分布偏移。
Even with high accuracy on the training set, distribution shift in real-world inputs can cause the classifier’s error rate to rise sharply.
即使在训练集上准确率很高,真实世界输入的分布偏移也可能使分类器的错误率大幅上升。
distribution 源自拉丁语 distribuere(“分配、散布”),经由法语进入英语,强调“事物如何被分散/分布”。shift 源自古英语 sciftan(“改变、转移”)。合在一起,distribution shift 直观表达“数据的分布发生了转移/变化”。