False-Discovery-Rate

Definition / 释义

False discovery rate（FDR，假发现率）：在进行多重假设检验时，被判定为“显著/发现”的结果中，实际上是错误（假阳性）的比例的期望值。常用于控制大规模检验（如基因组学、神经影像、A/B 测试）中的误报水平。
（注：与更严格的 FWER（家族错误率）不同，FDR允许一定比例的假阳性，以换取更高的发现能力。）

Pronunciation / 发音

/ˌfɔːls dɪˈskʌvəri reɪt/

Examples / 例句

If we test thousands of genes, we should control the false-discovery-rate.
如果我们检验成千上万个基因，就应该控制假发现率。

Using the Benjamini–Hochberg procedure, the team limited the false-discovery-rate to 5% while still identifying many meaningful signals.
团队使用 Benjamini–Hochberg 方法，将假发现率限制在 5%，同时仍识别出许多有意义的信号。

Etymology / 词源

该术语由三个常见统计学词组合而成：false（错误的）+ discovery（发现，指被判为显著的结果）+ rate（比率）。在多重检验背景下，“discovery”通常指“宣称发现了效应/差异”，而“false discovery”即“宣称显著但实际不存在的效应（假阳性）”。FDR作为正式指标在20世纪90年代由统计学家提出并推广，用来在“大规模同时检验”中更平衡地处理“漏报”和“误报”。

Related Words / 相关词

Literary Works / 文学与著作例证

Benjamini, Y. & Hochberg, Y. (1995), Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing（提出并系统化FDR控制思想的经典论文）
Storey, J. D. (2002), A Direct Approach to False Discovery Rates（提出并推广与FDR紧密相关的 q-value 概念）
Efron, B. (2010), Large-Scale Inference: Empirical Bayes Methods for Estimation, Testing, and Prediction（在大规模推断中多次讨论FDR及其变体）
Hastie, Tibshirani & Friedman (2009), The Elements of Statistical Learning（在多重比较/高维数据分析相关章节中涉及FDR控制思想）
Gelman et al. (2013/2020 editions), Bayesian Data Analysis（在比较与校正多重检验问题时常提及FDR等误差控制框架）