样本选择偏差:由于样本进入研究/数据集的机制并非随机(例如只观察到“被选中”的人或案例),导致样本不代表总体,从而使统计结论或因果推断产生系统性偏差。常见于调查回收、平台数据、医疗随访、就业/收入等“只对一部分人可见”的情境。
/ˈsæmpəl səˈlɛkʃən baɪəs/
Sample selection bias can occur if we only survey customers who choose to respond.
如果我们只调查愿意回复的顾客,就可能出现样本选择偏差。
In studies of wages, analyzing only employed people may create sample selection bias because employment is not random.
在工资研究中,只分析有工作的人可能会产生样本选择偏差,因为是否就业并非随机。
该术语由三部分构成:sample(样本) + selection(选择/筛选) + bias(偏差)。含义直观:当“样本是如何被选出来的”这一过程带有系统性倾向时,就会把这种倾向带入结果,形成偏差。经济学与社会科学中常与“可观测性/进入样本的门槛”问题一同讨论(如只看得到被录取、被诊断、被平台推荐的人)。