F-score(F分数):用于评估分类模型效果的指标,综合考虑Precision(精确率)与Recall(召回率),本质上是二者的调和平均数。最常见的是 F1-score(当精确率与召回率同等重要时)。也可扩展为 Fβ-score(用 β 调整对召回率或精确率的侧重)。
/ˈɛf skɔːr/
The F-score of our classifier improved after tuning the threshold.
调整阈值后,我们分类器的 F-score 提高了。
In imbalanced datasets, the F-score is often more informative than accuracy because it balances precision and recall.
在类别不平衡的数据集中,F-score 往往比准确率更有信息量,因为它在精确率与召回率之间取得平衡。
“F-score”中的 F 通常被解释为 “measure of effectiveness(有效性度量)” 的缩写传统,常用来表示将两个指标(精确率与召回率)综合成一个分数的做法;该指标在信息检索与机器学习评估中被广泛采用,并以 F1、Fβ 等形式延伸使用。