官术网_书友最值得收藏!

2.4.1 主成分分析的原理及模型

1.主成分分析原理

主成分分析采取一種數學降維的方法,找出幾個綜合變量來代替原來眾多的變量,使這些綜合變量能盡可能地代表原來變量的信息量,而且彼此之間互不相關。這種將把多個變量化為少數幾個互相無關的綜合變量的統計分析方法就叫作主成分分析或主分量分析。

主成分分析所要做的就是設法將原來眾多具有一定相關性的變量重新組合為一組新的相互無關的綜合變量來代替原來的變量。通常,數學上的處理方法就是將原來的變量進行線性組合,作為新的綜合變量,但是這種組合如果不加以限制,就可以有很多,應該如何選擇呢?如果將選取的第一個線性組合(第一個綜合變量)記為F1,自然希望它盡可能多地反映原來變量的信息,這里“信息”用方差來測量,即希望Var(F1)越大,表示F1包含的信息越多。在所有的線性組合中所選取的F1應該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來p個變量的信息,再考慮選取F2(第二個線性組合)。為了有效地反映原來的信息,F1已有的信息不需要出現在F2中,用數學語言表達就是要求Cov(F1, F2)=0,稱F2為第二主成分,以此類推,可以構造出第三、四、…p個主成分。

2.主成分分析的數學模型

對于一個樣本數據,觀測p個變量x1,x2,…,xpn個樣品的數據矩陣為:

(2.42)

其中: ZQ-185-009_inline_0086

主成分分析就是將p個觀測變量綜合成為p個新的變量(綜合變量),即

(2.43)

簡寫為:

(2.44)

要求模型滿足以下條件:

ZQ-185-009_inline_0090ZQ-185-009_inline_0091互不相關(ij, i,j=1,2,…,P);

ZQ-185-009_inline_0092的方差大于ZQ-185-009_inline_0093的方差,大于ZQ-185-009_inline_0094的方差;

ZQ-185-009_inline_0095。

于是,稱ZQ-185-009_inline_0096為第一主成分, ZQ-185-009_inline_0097為第二主成分,以此類推,有第p個主成分。主成分又叫主分量。這里aij稱為主成分系數。

上述模型可用矩陣表示為:

其中FAX

其中:

(2.45)

(2.46)

A稱為主成分系數矩陣。

主站蜘蛛池模板: 威远县| 堆龙德庆县| 安义县| 双桥区| 唐海县| 綦江县| 民和| 蕲春县| 道真| 普陀区| 潼南县| 江城| 台中县| 张家港市| 鹰潭市| 武穴市| 阜阳市| 平阴县| 衡山县| 涟源市| 延川县| 元谋县| 安平县| 新乐市| 剑川县| 尉氏县| 林西县| 泽州县| 乡城县| 留坝县| 庆元县| 安西县| 鄢陵县| 平泉县| 陆丰市| 景泰县| 昌乐县| 宁安市| 白银市| 怀宁县| 汉源县|