程序化标注:指通过代码、规则引擎或机器学习流程,自动或半自动地为数据(如文本、图像、日志、音频)生成标签,用于训练模型、检索、统计分析或内容管理。常见于数据标注(data labeling)与弱监督/远程监督(weak/distant supervision)场景。
/ˌproʊɡrəˈmætɪk ˈleɪbəlɪŋ/
programmatic 来自 program(程序、规划),表示“通过程序实现的、可用代码驱动的”;labeling 源于 label(标签),表示“贴标签/标注”。组合后强调“用程序手段进行标注”,区别于完全由人工逐条标注的方式。
We used programmatic labeling to tag customer emails by topic.
我们使用程序化标注按主题给客户邮件打标签。
To reduce annotation costs, the team combined heuristics and model predictions for programmatic labeling, then audited a small sample manually.
为降低标注成本,团队将启发式规则与模型预测结合进行程序化标注,并对少量样本进行人工抽检。