Pseudo-Label
定义 Definition
pseudo-label(伪标签):在机器学习/深度学习中,指由模型对未标注数据自动预测并生成的“标签”,再把它当作训练时的监督信号使用,常见于半监督学习与自训练(self-training)方法中。(有时也泛指“看起来像标签、但并非人工真实标注”的标签。)
发音 Pronunciation (IPA)
/ˈsuːdoʊ ˌleɪbəl/
例句 Examples
We added pseudo-labels to the unlabeled data.
我们给未标注数据加入了伪标签。
After the model reached a stable accuracy, it generated pseudo-labels for new samples, which helped improve performance without extra annotation.
当模型准确率稳定后,它为新样本生成伪标签,从而在不增加额外人工标注的情况下提升了性能。
词源 Etymology
pseudo- 来自希腊语 pseudes,意为“假的、伪的”;label 意为“标签”。合起来就是“伪造/自动生成的标签”。该术语在机器学习语境中流行,强调这些标签并非人工真值(ground truth),而是模型推断结果。
相关词 Related Words
文献与著作 Literary / Notable Works
- Dong-Hyun Lee (2013): Pseudo-Label: The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks(提出并推广“pseudo-label / pseudo-labeling”在深度学习半监督训练中的用法)
- Kihyuk Sohn et al. (2020): FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence(方法中使用高置信度预测作为伪标签)
- Olivier Chapelle, Bernhard Schölkopf, Alexander Zien (eds.) (2006): Semi-Supervised Learning(半监督学习经典著作,讨论与伪标签/自训练相近的思路与方法)