置换检验

置换检验permutation test)是统计学上一种基于反证法重抽样原则的非参数性检验,由罗纳德·艾尔默·费希尔Ronald Aylmer Fisher)与E・J・G・皮特曼英语E. J. G. PitmanE. J. G. Pitman)于20世纪30年代最早提出[1]

在两个样本容量分别为4与5的样本之间进行置换检验的说明图。此处置换检验的检验统计量为两样本间平均数之差。置换检验中,首先将两个样本混合打乱后,再分别抽出4个数与5个数,重新计算平均数之差,之后再计算出有多少次置换中得到的新样本间平均数之差大于置换前两样本间平均数之差(图中的纵向黑线即表示置换前两样本间平均数之差)

置换检验的零假设(虚无假设)为,即所有样本都服从同一分布。置换检验通过对比样本置换后的检验统计量与置换前的检验统计量来决定是否拒绝零假设、接受备择假设

方法

进行置换检验前,首先计算两样本(样本容量设为 )之间原本的检验统计量。检验统计量可以是两样本间平均数之差、方差之差,或t值卡方检验中的 值等,但这一统计量原则上在重新抽样后应大致符合某一统计学分布(如正态分布、t分布、f分布等)[2]:355-360。随后,将两个样本打乱后再重新选出两组容量等于之前两样本的新样本(即两个样本容量同样为 的样本)并计算新的检验统计量。如接受零假设 ,即样本源于同一分布,则随机抽样计算出的新检验统计量应不难大于最初置换前算出的两样本间检验统计量(如为双侧检验,则是其绝对值应不难大于置换前算出的两样本间检验统计量),即这个概率应大于设定的I型错误(假阳性)概率 。反之,则拒绝零假设 ,接受备择假设 ,即样本来自不同的分布。实际计算时,当两个样本容量都很大时,穷举所有置换并计算新的检验统计量所需的计算量过于庞大,因此常采用蒙特卡罗模拟的办法进行置换检验。蒙特卡罗模拟中,只做一定次数的打乱重选(置换)并计算检验统计量,再用这些计算出的检验统计量与置换前原本的检验统计量进行对比[3][4]

优势与不足

置换检验能用于两个分布不明且都不符合正态分布的样本之间的统计检验,是对较常用的t检验、方差分析(ANOVA)等参数检验的一个补充[5]。即使实验是非均衡设计(即样本容量不同),依然能够对样本进行置换检验[6]

另一方面,和其他基于秩的非参数检验相似,置换检验是一种相对保守的检验。如果对两个差别较小的小样本进行置换检验,则很容易接受零假设、拒绝备择假设(即检验功效相对较低)[7][8]

参见

参考文献