統計相關(粵拼:tung2 gai3 soeng1 gwaan1;英文:statistical correlation)喺統計學上嘅定義如下:
- 如果話
同
呢兩個變數成正相關,即係話
數值高嗰陣
數值都傾向高,而
數值低嗰陣
數值都傾向低; - 如果話
同
呢兩個變數成負相關,即係話
數值高嗰陣
數值傾向低,而
數值低嗰陣
數值就會傾向高; - 如果話
同
呢兩個變數冇明顯相關,即係話
嘅數值唔會點預測得到
嘅數值。
統計相關呢個概念,喺經濟學同語言學等各種社科上都會用到。
常用計法
皮亞遜積差相關係數(Pearson correlation coefficient)係統計學成日用嘅一個指標,「兩個變數
同
之間嘅皮亞遜積差相關係數」(
)係噉樣定義嘅:
![{\displaystyle \rho _{X,Y}=\mathrm {corr} (X,Y)={\mathrm {cov} (X,Y) \over \sigma _{X}\sigma _{Y}}={E[(X-\mu _{X})(Y-\mu _{Y})] \over \sigma _{X}\sigma _{Y}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/703c6c57ff55837364925723de4071e5c3e19167)
係第
個個案嘅
數值;
係第
個個案嘅
數值;
係啲個案喺
上嘅平均值(mean);
係啲個案喺
上嘅平均值;
係啲個案喺
上嘅標準差(SD);
係啲個案喺
上嘅標準差。
呢條式會得出一個相關值,個數值會喺 -1 同 1 之間,
- 負數表示兩個變數成反比(一個數值高嗰陣另一個傾向數值低),
- 正數就表示兩個變數成正比(兩個數值傾向一齊高或者一齊低),
- 個相關值愈接近零表示兩個變數之間嘅關係愈弱,
- 而如果個相關值等於零就表示兩個變數根本唔啦更。
喺做相關性研究嗰陣科學家會先收集一啲數據,再用好似上面呢條式等嘅方法計出變數之間嘅相關值,搵出研究緊嘅變數之間有乜嘢啦掕,而呢個過程俾出嚟嘅資訊喺將來有得攞嚟預測某啲現象[1]。
圖嘅 X 軸同 Y 軸代表變數
同
,每個有色圓點代表一個個案,每個個案都喺
同
上各有數值,而每幅圖表示唔同
值下啲數據會係點嘅樣。常犯錯誤
應用
統計相關有好多用途。
多角投資係投資上嘅一種做法,講到一位投資者要同時揸多種唔同嘅資產,即係例如同時又揸股票又揸黃金呀噉。多角投資相關嘅研究又提到,自己手上嘅唔同資產之間喺價格上唔應該有太強嘅正相關,即係呢啲資產嘅價唔可以傾向一齊升或者一齊跌,否則就好易出現「手上啲資產嘅價全部一齊下跌」嘅困境[2]。
實際行因素分析之前,研究者可以先睇吓啲變數之間嘅統計相關。有統計學專家主張,啲變數之間嘅統計相關最少要係 .30,先至有可能表示佢哋反映緊某啲潛在變數。
文獻
睇埋
引咗