Macro-averaging
定义 Definition
宏平均(macro-averaging):在评估分类模型(尤其是多类别或多标签任务)时,先对每个类别分别计算指标(如 Precision/Recall/F1),再对这些类别指标做算术平均。它通常让每个类别权重相同,因此对少数类更敏感。
(注:与 micro-averaging 相对;micro 通常先汇总总体 TP/FP/FN 再算指标。)
发音 Pronunciation (IPA)
/ˌmækroʊ ˈævərɪdʒɪŋ/
例句 Examples
Macro-averaging treats each class equally in the final score.
宏平均在最终分数中对每个类别一视同仁。
In imbalanced datasets, macro-averaged F1 can reveal poor performance on minority classes that overall accuracy may hide.
在类别不平衡的数据集中,宏平均 F1 能揭示少数类上的糟糕表现,而总体准确率可能会掩盖这一点。
词源 Etymology
该术语由 macro-(“宏观的、整体层面的”)与 averaging(“求平均”)组成。在机器学习评估语境中,“macro”强调以‘类别为单位’先分别计算,再在更高层级做平均,以体现对每个类别的同等关注。
相关词 Related Words
文学与著作中的用例 Literary & Notable Works
- Introduction to Information Retrieval(Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze)——讨论分类/检索评估指标时常涉及 macro-averaged 度量。
- Mining of Massive Datasets(Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman)——在大规模分类与评估章节中常出现宏/微平均的指标对比。
- Machine Learning: The Art and Science of Algorithms that Make Sense of Data(Peter Flach)——讲解模型评估与多类指标时会提到宏平均思想。
- The Elements of Statistical Learning(Hastie, Tibshirani, Friedman)——在模型评估框架与相关讨论中常与分类指标一并出现(具体术语在不同版本/语境中出现频率不一)。