数据标注:为原始数据(如文本、图像、音频、视频或传感器数据)添加结构化的标签、分类或说明,用于训练、评估和改进机器学习/人工智能模型。(在不同场景也可指“数据注释/批注”,但最常见用法是 AI 训练中的“标注”。)
We need data annotation before we can train the model.
在训练模型之前,我们需要进行数据标注。
High-quality data annotation, with clear guidelines and consistency checks, can significantly improve a system’s performance on real-world tasks like object detection and sentiment analysis.
高质量的数据标注(包含清晰规范与一致性检查)能显著提升系统在目标检测、情感分析等真实任务中的表现。
/ˈdeɪtə ˌænəˈteɪʃən/(也常见 /ˈdætə ˌænəˈteɪʃən/)
data 源自拉丁语 datum(“给出的东西”),后来指“信息/数据”;annotation 来自拉丁语 annotare(ad- “向/附加” + notare “做标记/记录”),意为“注释、批注”。合起来 data annotation 即“对数据做标记与说明”。