False-Discovery-Rate
Definition / 释义
False discovery rate(FDR,假发现率):在进行多重假设检验时,被判定为“显著/发现”的结果中,实际上是错误(假阳性)的比例的期望值。常用于控制大规模检验(如基因组学、神经影像、A/B 测试)中的误报水平。
(注:与更严格的 FWER(家族错误率)不同,FDR允许一定比例的假阳性,以换取更高的发现能力。)
Pronunciation / 发音
/ˌfɔːls dɪˈskʌvəri reɪt/
Examples / 例句
If we test thousands of genes, we should control the false-discovery-rate.
如果我们检验成千上万个基因,就应该控制假发现率。
Using the Benjamini–Hochberg procedure, the team limited the false-discovery-rate to 5% while still identifying many meaningful signals.
团队使用 Benjamini–Hochberg 方法,将假发现率限制在 5%,同时仍识别出许多有意义的信号。
Etymology / 词源
该术语由三个常见统计学词组合而成:false(错误的)+ discovery(发现,指被判为显著的结果)+ rate(比率)。在多重检验背景下,“discovery”通常指“宣称发现了效应/差异”,而“false discovery”即“宣称显著但实际不存在的效应(假阳性)”。FDR作为正式指标在20世纪90年代由统计学家提出并推广,用来在“大规模同时检验”中更平衡地处理“漏报”和“误报”。
Related Words / 相关词
Literary Works / 文学与著作例证
- Benjamini, Y. & Hochberg, Y. (1995), Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing(提出并系统化FDR控制思想的经典论文)
- Storey, J. D. (2002), A Direct Approach to False Discovery Rates(提出并推广与FDR紧密相关的 q-value 概念)
- Efron, B. (2010), Large-Scale Inference: Empirical Bayes Methods for Estimation, Testing, and Prediction(在大规模推断中多次讨论FDR及其变体)
- Hastie, Tibshirani & Friedman (2009), The Elements of Statistical Learning(在多重比较/高维数据分析相关章节中涉及FDR控制思想)
- Gelman et al. (2013/2020 editions), Bayesian Data Analysis(在比较与校正多重检验问题时常提及FDR等误差控制框架)