官术网_书友最值得收藏!

1.5 協(xié)方差矩陣與相關(guān)矩陣

1.5.1 協(xié)方差矩陣

兩個(gè)變量之間的樣本協(xié)方差,等于其對應(yīng)觀測值離均值乘積的平均,即

分別表示變量X1與X2的一組觀測數(shù)據(jù)的平均值,n為樣本量。

若有p(p≥2)個(gè)變量的話,其樣本協(xié)方差S可用下面的矩陣來表示:

式中Xc為(1.4)定義的離均值矩陣,p為變量個(gè)數(shù)。S矩陣是對稱矩陣,即

利用(1.6),我們可以算出表1.1(a)中三個(gè)變量的協(xié)方差矩陣(參見表1.5(a))。表1.5(a)中對角元素為各個(gè)變量的方差、非對角元素就是變量與其他變量間的協(xié)方差。顯然對角線兩邊的協(xié)方差對應(yīng)相等(例如,右上角語文與英語的協(xié)方差為24.25,左下角英語與語文的協(xié)方差同樣為24.25),故協(xié)方差矩陣常用下三角式表示(表1.5(b))。

表1.5(a)多元變量數(shù)據(jù)的協(xié)方差矩陣

表1.5(b)三角式的協(xié)方差矩陣

但是統(tǒng)計(jì)軟件SPSS輸出協(xié)方差矩陣時(shí),無偏協(xié)方差矩陣是其默認(rèn)值。表1.1(a)中數(shù)據(jù)的無偏協(xié)方差矩陣如表1.6所示。樣本量較小時(shí),方差(或協(xié)方差)與無偏方差(或無偏協(xié)方差)略有差異,當(dāng)樣本量足夠大時(shí),則基本一致。

表1.6 多元變量數(shù)據(jù)的(無偏)協(xié)方差矩陣

1.5.2 相關(guān)系數(shù)矩陣

兩個(gè)隨機(jī)變量X和Y的協(xié)方差可以反映這兩個(gè)變量相關(guān)變化的趨勢。但是協(xié)方差受到諸變量測量單位的影響,其數(shù)值無法比較大小。統(tǒng)計(jì)學(xué)中將樣本協(xié)方差除以兩個(gè)變量的標(biāo)準(zhǔn)差之積,稱為樣本的積差相關(guān)系數(shù)(product-moment coefficient of correlation,簡稱為相關(guān)系數(shù)),標(biāo)記為rXY,即

相關(guān)系數(shù)是沒有單位的數(shù)(scale),下限為-1,上限為1。相關(guān)系數(shù)大于0時(shí),常稱兩變量為正相關(guān),反之則稱為負(fù)相關(guān);相關(guān)系數(shù)為0時(shí),稱兩變量無相關(guān)。

如果用x表示變量X的n個(gè)離均值構(gòu)成的向量,用y表示變量Y的n個(gè)離均值構(gòu)成的向量,則式(1.7)中各項(xiàng)可表示為

將式(1.8a, b,c)代入式(1.7),則

式中θXY為向量x與y之間的夾角。從而可知,對于中心化的數(shù)據(jù),相關(guān)系數(shù)也可視為兩個(gè)隨機(jī)變量構(gòu)成的向量間夾角的余弦函數(shù)。

如果有p(p≥2)個(gè)標(biāo)準(zhǔn)化變量,則樣本相關(guān)系數(shù)矩陣R為

式中Z為式(1.5)定義的標(biāo)準(zhǔn)分矩陣。各變量自身的相關(guān)均為1。比較式(1.10)與(1.6)可知,相關(guān)系數(shù)矩陣與其標(biāo)準(zhǔn)化變量的協(xié)方差矩陣是一致的,即

相關(guān)系數(shù)=標(biāo)準(zhǔn)分的協(xié)方差。

例如,表1.1(a)的變量間相關(guān)系數(shù)如表1.7所示,這個(gè)表一般稱為相關(guān)系數(shù)矩陣。相關(guān)系數(shù)矩陣中元素是關(guān)于對角線對稱的,通常只標(biāo)出下三角中的元素。

表1.7 多元變量數(shù)據(jù)的相關(guān)系數(shù)矩陣

主站蜘蛛池模板: 穆棱市| 天气| 衡阳县| 吉木萨尔县| 稻城县| 丽水市| 洱源县| 鄂伦春自治旗| 大港区| 昭觉县| 中宁县| 肃南| 招远市| 抚顺县| 三门峡市| 时尚| 历史| 平乐县| 克山县| 牙克石市| 绿春县| 桂东县| 广昌县| 陕西省| 梁山县| 广灵县| 梁平县| 汽车| 娄底市| 喀什市| 新平| 山东| 宝清县| 永德县| 政和县| 土默特左旗| 平利县| 礼泉县| 普安县| 炎陵县| 崇明县|