官术网_书友最值得收藏!

§3.5 多元回歸模型的設定偏誤

一、正確的多元回歸模型

在前面的討論中,我們假定所用回歸模型是正確設定的,正確設定的回歸模型應具有如下特點:

(1)模型中只包含關鍵變量,也就是說所選定的模型是最簡便的。

模型是對現實經濟系統的抽象。一個模型應盡量簡單,我們應在設定模型時只引進抓住現實本質的關鍵變量,把影響微弱的變量放到干擾項u中去。

(2)模型參數可識別。對于給定的一組數據,估計的參數具有唯一值。

(3)較高的擬合優度。

要用解釋變量X解釋被解釋變量Y, X對Y的解釋能力就應該較高,就要求有盡可能高的R2

(4)估計的回歸系數與經濟理論一致。

如果回歸模型中估計的參數的符號是錯誤的,那么回歸模型也是不成立的。

一個正確的回歸模型的判定并沒有一個統一的標準,在計量經濟分析實踐中,我們會使用各種檢驗方法去判斷回歸模型的性質,第四章會重點闡述這些內容。

多元回歸模型的設定偏誤主要包括以下三種:

(1)回歸模型中包含了無關解釋變量;

(2)回歸模型中遺漏了重要解釋變量;

(3)回歸模型中的函數形式設定偏誤。

下面將分別予以討論。

二、回歸模型中包含了無關解釋變量

多元回歸模型中包含了無關解釋變量,即對模型進行了過度設定。就是說,我們把一個在總體回歸模型中對Y沒有影響的解釋變量放到了樣本回歸模型中。假定真實模型為:

而我們設定的回歸模型為

解釋變量X3對Y沒有影響,X3在總體回歸模型(3.91)中的參數β3=0。在模型(3.92)中,X3是一個與被解釋變量Y無關的變量。引入X3將導致如下結果:

(1)有誤模型(3.92)的參數最小二乘估計量均無偏,即E()=β1,E()=β2和E()=β3=0。

(2)的方差非最小,都大于正確模型(3.91)中的方差。也就是說,在模型(3.92)中,X3的引入將使的方差無必要地增大,降低估計的精度。

三、回歸模型中遺漏了重要解釋變量

在多元回歸模型中,遺漏了一個實際上應該包括在總體模型中的解釋變量,稱為對模型設定不足。就是說,我們遺漏了一個對被解釋變量有顯著影響的解釋變量。

假定真實模型為

而我們設定的回歸模型為

X3是對Y有顯著影響的變量,而在模型(3.94)中卻將其漏掉了。遺漏X3將導致如下后果:

(1)如果遺漏的變量X3與包含的變量X2相關,則是有偏誤的,且非一致。就是說,E()不等于β1,E()不等于β2,而且不論樣本多大,偏誤都不會消失。

(2)如果X3與X2不相關,則是有偏誤的,而則是無偏的。

(3)σ2不能正確地估計。

(4)根據所估計的參數的統計顯著性,容易導出錯誤的結論。

例3.10 在例3.8中,為了說明線性到對數回歸模型的應用,使用了一元回歸模型,但這很可能是一個有誤的設定。因為影響經濟增長的因素除了能源消費量外還有勞動投入、資本投入、技術進步、制度、金融等非能源類因素的影響,在此我們用時間變量t代表這些因素。則回歸模型應為

其中Y是國內生產總值(億元),X為能源消費總量,t是時間(t=1,2,……,15)。

時間變量t的使用是計量經濟分析中的常用手段。第一,當我們研究的興趣僅僅在于變量的時間特性時,我們就使用時間t作解釋變量。例如,研究GDP、就業率、股票價格隨時間變化的規律性。第二,有時要選擇的解釋變量是無法觀測的或難以獲得數據,我們就用t變量作為它們的替代變量。此時,我們假定這個無法測定的變量是時間變量t的函數。

在本例中,我們用時間變量t代表所有除能源消費量外影響經濟增長的因素,設定其他影響因素是時間變量t的函數。

利用表3.4中的數據,設定t=1,2,……,15,使用普通最小二乘法,得到回歸模型

對比式(3.85)和式(3.96)可知:

(1)一元回歸模型中,能源消費量每增加1%,GDP平均增長2306.05億元。而在引入時間變量t的多元回歸模型中,能源消費量每增加1%,GDP平均增長574.71億元。一元回歸模型中由于設定偏誤,高估了能源消費量對經濟增長的影響。由于遺漏了時間趨勢變量,能源消費量就承擔了遺漏變量對GDP的影響,因而無法準確測定能源消費量對GDP的真實影響。

(2)兩個模型的標準誤也是不同的。

(3)多元回歸模型中擬合優度要優于一元回歸模型。

由此可見,如果在回歸分析中遺漏了重要解釋變量,將會帶來較嚴重的后果。所以在建立回歸分析模型時,就必須深入了解建模的有關經濟理論,將影響被解釋變量的重要變量引入到回歸模型中。

四、回歸模型的函數形式設定偏誤

如果回歸模型的函數形式設定有誤也會產生設定誤差。

經濟理論只能告訴我們經濟系統中各經濟變量之間的相互關聯性,并不能闡明變量之間關聯的函數形式。

例如,使用生產函數時,根據經濟理論我們只能知道產出是投入要素的函數,并未告訴我們具體的函數形式。我們可以用線性函數也可以用對數線性函數去研究它:

式(3.97)中β2,β3為斜率;式(3.98)中α2,α3為彈性,兩者意義不同。在線性函數中,彈性為β2(X2/Y),β3(X3/Y),是一個變彈性模型,而式(3.98)的彈性α2,α3為常數,是一個不變彈性模型。只有選擇了正確的函數形式,才能得到有效估計和正確的經濟解釋。

為了研究的方便,我們通常將非線性模型用線性模型去近似表達,這種近似必然存在誤差,從而影響參數估計的效果。

例如,當變量真實關系為多項式模型:

而我們在研究中使用了線性模型

則線性模型(3.100)中,遺漏了變量X2和X3,且遺漏變量與X相關,用普通最小二乘法估計參數是有偏誤的。

函數形式的設定偏誤有多種多樣,我們在選擇模型的函數形式時必須謹慎小心,而這又是一個探索和改進的過程,我們只能通過不斷的嘗試來找到最恰當的函數形式。

主站蜘蛛池模板: 逊克县| 肇州县| 洱源县| 如东县| 罗平县| 深水埗区| 当阳市| 施甸县| 玉树县| 榆社县| 秦安县| 台山市| 朝阳市| 繁昌县| 米泉市| 西林县| 丰顺县| 洛宁县| 泰顺县| 宜兰市| 龙岩市| 泽州县| 双峰县| 乌什县| 龙口市| 镇江市| 道孚县| 永和县| 饶平县| 五家渠市| 醴陵市| 孟村| 泉州市| 张掖市| 正蓝旗| 遂川县| 新宁县| 日土县| 兴隆县| 攀枝花市| 辽宁省|