validation data:验证数据/验证集。在机器学习与统计建模中,指从数据集中单独划分出来的一部分数据,用于在训练过程中评估模型表现、调整超参数、进行模型选择,以减少过拟合风险。它不同于最终用于客观评估的 test set(测试集)。
/ˌvælɪˈdeɪʃən ˈdeɪtə/ (也常见 /ˌvælɪˈdeɪʃən ˈdætə/)
We used 20% of the dataset as validation data.
我们把数据集的 20% 用作验证数据。
After tuning hyperparameters on the validation data, the team evaluated the final model on a separate test set to estimate real-world performance.
在验证数据上调好超参数后,团队在单独的测试集上评估最终模型,以估计真实世界中的表现。
validation 来自拉丁语 validus(“强的、有效的”),引申为“验证其有效性”。data 源自拉丁语 datum(“给出的东西”),在现代英语中常作为集合名词使用。合起来 validation data 字面意思是“用于验证有效性的数据信息”,在机器学习语境中固定指“用于调参和模型选择的那部分数据”。