中位數

數值集合中,不大於一半元素,也不小於另一半元素的數

統計學上,中位數(英語:Median),又稱中央值[1]中值,是一個樣本、種群或概率分佈中之一個數值,其可將數值集合劃分爲数量相等的上下兩部分。對於有限的數集,可以通過把所有觀察值高低排序後找出正中間的一個作爲中位數。如果觀察值有偶數個,則中位數不唯一,通常取最中間的兩個數值的平均數作爲中位數。

一個數集中最多有一半的數值小於中位數,也最多有一半的數值大於中位數。如果大於和小於中位數的數值個數均少於一半,那麽數集中必有若干值等同於中位數。

连续随机变量X的分布函数为F(X),那么满足条件P(X≤m)=F(m)=1/2的数称为X或分布F的中位数。

对于一组有限个数的数据来说,其中位数是这样的一种数:这群数据的一半的数据比它大,而另外一半数据比它小。

计算有限个数的数据的中位数的方法是:把所有的同类数据按照大小的顺序排列。如果数据的个数是奇数,则中间那个数据就是这群数据的中位数;如果数据的个数是偶数,则中间那2个数据的算术平均值就是这群数据的中位数。

公式

實數 按大小順序(順序,降序皆可)排列為

實數數列 的中位數

其中 odd number 表示奇數,even number 表示偶數。


中位數特性

中位數在敘述統計學上和平均数、众数並列為數據的集中趨勢。三者的位置排序亦對應著偏度的正負偏態意義。一般而言,平均數是最常被使用做為數據的集中趨勢,但如果有極端值存在,平均數的代表性降低,也就所謂的「男人女人平均一顆睪丸」的問題,因此在有極端值的狀況下,中位數是比較好的集中趨勢代表。因此,在各國的每人所得分布上,通常以中位數代表集中趨勢,而非平均數[2]

中位數通常出現在描述统计学無母數統計,有母數的統計分析很少提及。中位數為集中趨勢時,對應的離散趨勢係數為平均絕對離差(Mean absolute deviation, MAD)或是四位位距(Q3 - Q1)。不過如果論及母體中位數的統計量時,仍需根據統計分析對抽樣分配的要求,尋找母體中位數統計量的期望值與變異數,再依照點估計的充分、不偏、效率、一致性進行討論。而母體中位數的統計量通常是樣本中位數。因此,樣本中位數的期望值與變異數就值得被討論,進行基礎研究。

常態分配下的中位數

常態分配下的平均數、中位數、眾數都是同一個位置。目前最為世人熟知的是平均數的抽樣分配會是常態分配,期望值為母體平均數 且變異數為母體變異數( )。統計學對常態分配的母體平均數統計量說明甚多,並發展完善。那麼中位數可基於機率分配模擬器和數值分析發展,在n個獨立隨機變數來自常態分配可生成n個隨機樣本,則E(樣本中位數)= 且Var(樣本中位數)= ,其中,k(n)受到樣本個數(n)影響。當樣本個數介於2至200時,兩者的關係不明顯,但可計算出樣本個數和k(n)的關聯表[3]

k(n)和n的對應表
nk(n)nk(n)nk(n)
20.500267128700.0219851791380.011271806
30.448703237710.0214036371390.011269587
40.298172500720.0213932711400.011109049
50.286770401730.0208408451410.011111745
60.214713620740.0208304271420.010959968
70.210476952750.0202958641430.010962027
80.168172011760.0202945991440.010810205
90.166171644770.0197769711450.010809127
100.138304145780.0197774661460.010661452
110.137221972790.0192917771470.010659591
120.117603985800.0192947671480.010513172
130.116875871810.0188319551490.010523498
140.102209683820.0188268541500.010377973
150.101704592830.0183946571510.010379735
160.090397468840.0183904671520.010244606
170.090046842850.0179726571530.010247290
180.081017991860.0179723091540.010109136
190.080776427870.0175674471550.010114347
200.073450103880.0175643401560.009986419
210.073284584890.0171872951570.009984465
220.067168338900.0171891101580.009862704
230.067002164910.0168129031590.009858886
240.061881619920.0168136661600.009735345
250.061762647930.0164666601610.009736185
260.057309720940.0164626681620.009617128
270.057271174950.0161254881630.009619325
280.053440064960.0161192371640.009501480
290.053332370970.0158028801650.009502525
300.049992614980.0157978561660.009389839
310.049937448990.0154928721670.009388423
320.0470293511000.0154904321680.009279058
330.0469652111010.0151907731690.009277712
340.0443379881020.0151897761700.009169514
350.0443365581030.0149045671710.009169768
360.0419909271040.0148966401720.009061071
370.0419422181050.0146287251730.009060657
380.0398529271060.0146236381740.008961003
390.0398324581070.0143594521750.008957769
400.0379390731080.0143591661760.008860612
410.0379047451090.0141006141770.008859363
420.0361842741100.0141041291780.008762802
430.0361521921110.0138568181790.008760489
440.0345795911120.0138547121800.008665028
450.0345775691130.0136096001810.008663662
460.0331331771140.0136106801820.008571695
470.0331188071150.0133833601830.008570240
480.0317911451160.0133823291840.008475410
490.0317833991170.0131537281850.008477845
500.0305488731180.0131561671860.008388634
510.0305338111190.0129385601870.008384818
520.0294118821200.0129394551880.008300454
530.0294028851210.0127297061890.008300175
540.0283476911220.0127313811900.008214157
550.0283420621230.0125330401910.008211878
560.0273487471240.0125251811920.008130539
570.0273504731250.0123338991930.008128310
580.0264428091260.0123344081940.008045347
590.0264362891270.0121410841950.008041810
600.0255732421280.0121385221960.007964784
610.0255752791290.0119640571970.007961234
620.0247806101300.0119618871980.007882679
630.0247519231310.0117828741990.007882009
640.0240055741320.0117799412000.007806200
650.0240066881330.0116042162010.007801090
660.0233042091340.0116009082020.007729016
670.0232874601350.0114333152030.007728333
680.0226169081360.0114385872040.007654504
690.0226244251370.0112718062050.007652196

如果樣本個數超過200,但不超過1000時,兩者有明顯的關係,並且受到樣本個數是否為奇數或偶數影響。此時可使用迴歸分析尋找兩者的關係。

1. 樣本個數為偶數,迴歸式為k(n) = 0.0000148965 + 1.5599936862 / n。

2. 樣本個數為奇數,迴歸式為k(n) = 0.0000084608 + 1.5674001064 / n。

由此可得到樣本中位數的變異數和母體常態分配的變異數形成穩定的對應關係[4]

參考文獻

外部链接

本條目含有来自PlanetMathMedian of a distribution》的內容,版权遵守知识共享协议:署名-相同方式共享协议