官术网_书友最值得收藏!

§3.3 多元線性回歸模型的檢驗

一、回歸系數的顯著性檢驗——t檢驗

回歸分析的目的不僅僅是得到βj的估計值,而同時要對總體回歸函數中的每個βj的假設進行檢驗。總體回歸模型為

如果式(3.51)滿足經典假定,則是經典線性回歸模型。我們知道,βj是總體參數,是未知數,總體信息未知時,βj是不可測的。但是,我們可以對βj的值做出假設,通過統計推斷來檢驗我們的假設。

可以證明,在ui服從正態分布及經典假定條件下,

服從自由度為n-k的t分布。k為總體回歸模型的參數個數,βj為總體回歸參數,為βj的普通最小二乘估計量,se()為的標準誤。

在計量經濟分析中,我們最關心的是解釋變量Xj是否與被解釋變量Y線性相關。因此,我們的主要目的在于檢驗原假設

式(3.53)中,j對應k-1個解釋變量中的任意一個。βj是第j個變量的偏回歸系數,度量了在所有其他解釋變量不變的條件下,Xj對Y的影響。即Xj變化一個單位,對Y的期望值的影響。如式(3.53)成立,即βj=0,則意味著Xj對Y的期望值沒有任何影響。例如,考慮工資模型

其中Wi為工資,ei為受教育水平,EPi為工作經驗。原假設H0:β3=0意味著在受教育程度相同的條件下,工作經驗對工資沒有影響。這個假設價值很大,如果它是正確的,那么就是說個人在任現職之前的工作經驗不會影響他的工資水平。如果β3>0,則意味著以前的工作經驗對現在的工資水平有促進作用。

在計量經濟分析中,備擇假設通常設定為

式(3.55)表示Xj對Y有顯著影響,βj可正可負。

與一元回歸分析相同,對βj進行檢驗使用如下的t統計量:

給定和標準誤se(),該t統計量就很容易獲得。回歸分析軟件都直接報告t統計量及其標準誤。

在式(3.56)中,se()>0,所以t的符號相同。在se()給定的條件下,|t|與||成正比。我們要檢驗的是原假設H0:βj=0,因為βj不可測,我們只能用βj的無偏估計量來進行統計推斷。在實際分析中,點估計值不可能正好為0,的樣本值與0相差越遠,拒絕原假設H0:βj=0的可能性越大。由于在估計中存在抽樣誤差,所以的大小就必須由其抽樣誤差來衡量,即由的標準誤se()來衡量。因此,t度量了被估計的與0相差多大的值充分遠離0將導致拒絕原假設H0:βj=0,拒絕的標準決定于所選擇的顯著性水平α。

我們所進行的假設檢驗是關于總體參數的,我們不是在檢驗一個來自特定樣本的估計值。因此,將一個原假設表達成“H0=0”,或者在樣本中的參數估計值是0.205時說“H0:0.205=0”,都是毫無意義的,我們要檢驗的是未知總體參數βj是否為0。

多元回歸中的t檢驗決策規則與一元回歸相同。

例3.3 工資回歸模型。

例3.1中的工資回歸模型如下:

其中Y為工資,X2為受教育年限,X3為工齡,X4為現任職務的任期。

查t分布表可知,5%顯著性水平下的臨界值t0.025(522)=1.96.模型中參數的t統計量均大于臨界值t0.025(522)=1.96,每一個估計的偏回歸系數都是統計上顯著的,即顯著地異于0。也就是說,我們拒絕每個原假設。這就意味著模型中的三個解釋變量:受教育年限、工齡和現任職務的任期對被解釋變量-工資都有顯著的影響。

二、回歸模型的整體顯著性檢驗——F檢驗

我們除了要判斷每一個偏回歸系數的顯著性外,還需要對多元回歸模型的總體顯著性進行判斷。多元回歸模型的總體顯著性就是對原假設

進行檢驗。檢驗的目的就是判斷被解釋變量Y是否與X2,X3,……,Xk在整體上有線性關系。

例如,對于二元回歸模型

若原假設H0:β23=0成立,則表明Y與X2,X3沒有線性關系,X2,X3對Y都沒有顯著的線性影響。這個回歸模型應為

式(3.60)表明,式(3.59)的回歸模型是不能成立的。在整體顯著性檢驗中對應的備擇假設為H1:β2和β3不同時為0。備擇假設的組合有三種結果:

(1)β2≠0且β3≠0;

(2)β2≠0且β3=0;

(3)β2=0且β3≠0。

不論這三種情況的哪一種發生,式(3.59)均成立,稱為回歸模型整體顯著。

在一元回歸模型中,只有一個解釋變量,對個別回歸系數β2的t檢驗就是對回歸模型的整體顯著性檢驗。而在多元回歸模型中,可以證明,對回歸系數的逐一顯著性檢驗并不能代替對回歸模型的整體顯著性檢驗。

可以證明,對于多元線性回歸模型:

在ui服從正態分布和原假設H0:β23=……=βk=0條件下,變量

服從自由度為k-1和n-k的F分布,即

從F的表達式可以看出,如果原假設H0:β23=……=βk=0是真實的,則表明Y與X2,X3,……,Xk整體上無線性關系,Y的變異全部來源于干擾項ui,F統計量的值較小。如果原假設H0:β23=……=βk=0是虛假的,則表明Y與X2,X3,……,Xk整體上有線性關系,X2,X3,……,Xk對Y有顯著影響,則解釋平方和ESS要遠遠大于殘差平方和RSS,從而得到一個較大的F統計量。因此,式(3.63)的F統計量為我們提供了檢驗多元回歸模型整體顯著性的一種方法。利用F分布,在給定顯著性水平α下,查F分布表可得Fα(k-1,n-k),如果F>Fα,我們就拒絕H0,如果F<Fα就不拒絕H0。至此,我們得到多元回歸模型的整體顯著性檢驗決策規則:

(1)設定假設:

原假設H0:β23=……=βk=0;

備擇假設H1:βj不全為0,j=2,3,……,k

(2)計算F統計量:

(3)在給定顯著性水平α的條件下,查F分布表得臨界值Fα(k-1,n-k)。

(4)判斷:

如果F>Fα(k-1,n-k),則拒絕H0,接受備擇假設H1

如果F≤Fα(k-1,n-k),則不拒絕H0

可以證明F統計量與判定系數R2的關系如下:

式(3.65)表明,F統計量與R2是同向變化的。當R2=0時,F=0;R2越大,F值也越大。R2=1時,F無窮大。F檢驗即是對回歸模型整體顯著性的檢驗,也是對判定系數R2的一個顯著性檢驗。

例3.4 在例3.3中,R2=0.316,n=526,k=4,則

給定顯著性水平α=5%,第1自由度k-1=3,第2自由度n-k=522,查F分布表可得F0.05(3,522)=2.60。又因為F=80.3887>F0.05(3,522)=2.60,所以,工資回歸模型是整體顯著的,工資回歸模型成立。

例3.5 人口壽命回歸模型。

表3.1給出了1992年亞洲各國人均壽命Y,按購買力平價計算的人均GDP X2,成人識字率X3(%)和一歲兒童疫苗接種率X4(%)。在一個經濟系統中,人口壽命與生活水平、基本教育普及率和兒童疫苗接種狀況有密切關系。因此,要研究人口壽命問題,可將模型設定為

表3.1 1992年亞洲各國(地區)人的發展指標

注:表中數據來源于聯合國發展規劃署《人的發展報告》。

式(3.66)中,Y是人均壽命,X2為人均GDP, X3是成人識字率,X4為一歲兒童疫苗接種率。

根據表3.1的樣本數據,使用普通最小二乘法估計參數,得到樣本回歸模型

人口壽命回歸模型評價:

(1)判定系數R2=0.889,說明解釋變量人均GDP、成人識字率、一歲兒童疫苗接種率解釋了人口壽命總變異的88.9%。

(2)回歸系數的檢驗。

式(3.67)樣本回歸模型中,自由度為22-4=18,取顯著性水平α=5%時,t0.025(18)=2.101。的t統計量分別為

可以看出,4個t統計量均大于t0.025(18),所以各偏回歸系數均顯著,說明模型中的解釋變量均對被解釋變量——人口壽命有顯著影響。人均GDP每增加100美元,人口平均壽命增加0.076年;成人識字率每增加1個百分點,人口平均壽命增加0.128年;一歲兒童疫苗接種率增加1個百分點,人口平均壽命增加0.210年。

實際上,從式(3.67)給出的實際顯著性p值可以看出,各偏回歸系數實際顯著性水平均小于0.01,也就是說,即使是1%的顯著性水平下,各偏回歸系數依然是顯著的。

(3)總體顯著檢驗——F檢驗。

式(3.67)中已給出F=47.891,已知k=4,n=22,自由度為k-1=3和n-k=18。取顯著性水平α=0.01,查F分布表可知F0.01(3,18)=5.09。F>F0.01(3,18),因此拒絕原假設H0:β23=……=βk=0,接受備擇假設H0:βj不全為0,j=2,3,……,k。說明人口人均壽命與人均GDP、成人識字率、一歲兒童疫苗接種率整體上有線性關系,人均GDP、成人識字率、一歲兒童疫苗接種率對人口人均壽命有顯著影響。

主站蜘蛛池模板: 太和县| 昌吉市| 盐亭县| 十堰市| 鸡西市| 阳江市| 金平| 蓬莱市| 永德县| 阿鲁科尔沁旗| 临江市| 孟津县| 兴国县| 县级市| 泾源县| 疏附县| 永昌县| 金阳县| 汶川县| 益阳市| 石城县| 卢湾区| 阳原县| 鲁甸县| 屯昌县| 永安市| 疏附县| 营口市| 旅游| 巴东县| 法库县| 会宁县| 孟津县| 大厂| 广州市| 容城县| 凤山县| 城步| 胶州市| 宜兰县| 永定县|