不平衡数据/类别不平衡数据:在分类等机器学习任务中,不同类别的样本数量差异很大(例如“正类”很少、“负类”很多),可能导致模型偏向多数类、对少数类识别效果差。
/ɪmˈbælənst ˈdeɪtə/ (也常见 /ɪmˈbælənst ˈdætə/)
Imbalanced data can make a classifier ignore rare cases.
不平衡数据可能会让分类器忽视少见情况。
In medical screening, imbalanced data often causes high accuracy but poor detection of the minority class.
在医学筛查中,不平衡数据常常导致“准确率很高”但对少数类的检出效果很差。
imbalanced 来自 balance(平衡) 加否定前缀 im-,表示“不平衡的”;data 源自拉丁语 datum(给出的东西),在现代英语中常指“数据”。合起来即“分布不均衡的数据”。