§3.5 多元回歸模型的設定偏誤
一、正確的多元回歸模型
在前面的討論中,我們假定所用回歸模型是正確設定的,正確設定的回歸模型應具有如下特點:
(1)模型中只包含關鍵變量,也就是說所選定的模型是最簡便的。
模型是對現實經濟系統的抽象。一個模型應盡量簡單,我們應在設定模型時只引進抓住現實本質的關鍵變量,把影響微弱的變量放到干擾項u中去。
(2)模型參數可識別。對于給定的一組數據,估計的參數具有唯一值。
(3)較高的擬合優度。
要用解釋變量X解釋被解釋變量Y, X對Y的解釋能力就應該較高,就要求有盡可能高的R2。
(4)估計的回歸系數與經濟理論一致。
如果回歸模型中估計的參數的符號是錯誤的,那么回歸模型也是不成立的。
一個正確的回歸模型的判定并沒有一個統一的標準,在計量經濟分析實踐中,我們會使用各種檢驗方法去判斷回歸模型的性質,第四章會重點闡述這些內容。
多元回歸模型的設定偏誤主要包括以下三種:
(1)回歸模型中包含了無關解釋變量;
(2)回歸模型中遺漏了重要解釋變量;
(3)回歸模型中的函數形式設定偏誤。
下面將分別予以討論。
二、回歸模型中包含了無關解釋變量
多元回歸模型中包含了無關解釋變量,即對模型進行了過度設定。就是說,我們把一個在總體回歸模型中對Y沒有影響的解釋變量放到了樣本回歸模型中。假定真實模型為:

而我們設定的回歸模型為

解釋變量X3對Y沒有影響,X3在總體回歸模型(3.91)中的參數β3=0。在模型(3.92)中,X3是一個與被解釋變量Y無關的變量。引入X3將導致如下結果:
(1)有誤模型(3.92)的參數最小二乘估計量均無偏,即E()=β1,E(
)=β2和E(
)=β3=0。
(2)的方差非最小,都大于正確模型(3.91)中
的方差。也就是說,在模型(3.92)中,X3的引入將使
,
的方差無必要地增大,降低估計的精度。
三、回歸模型中遺漏了重要解釋變量
在多元回歸模型中,遺漏了一個實際上應該包括在總體模型中的解釋變量,稱為對模型設定不足。就是說,我們遺漏了一個對被解釋變量有顯著影響的解釋變量。
假定真實模型為

而我們設定的回歸模型為

X3是對Y有顯著影響的變量,而在模型(3.94)中卻將其漏掉了。遺漏X3將導致如下后果:
(1)如果遺漏的變量X3與包含的變量X2相關,則和
是有偏誤的,且非一致。就是說,E(
)不等于β1,E(
)不等于β2,而且不論樣本多大,偏誤都不會消失。
(2)如果X3與X2不相關,則是有偏誤的,而
則是無偏的。
(3)σ2不能正確地估計。
(4)根據所估計的參數的統計顯著性,容易導出錯誤的結論。
例3.10 在例3.8中,為了說明線性到對數回歸模型的應用,使用了一元回歸模型,但這很可能是一個有誤的設定。因為影響經濟增長的因素除了能源消費量外還有勞動投入、資本投入、技術進步、制度、金融等非能源類因素的影響,在此我們用時間變量t代表這些因素。則回歸模型應為

其中Y是國內生產總值(億元),X為能源消費總量,t是時間(t=1,2,……,15)。
時間變量t的使用是計量經濟分析中的常用手段。第一,當我們研究的興趣僅僅在于變量的時間特性時,我們就使用時間t作解釋變量。例如,研究GDP、就業率、股票價格隨時間變化的規律性。第二,有時要選擇的解釋變量是無法觀測的或難以獲得數據,我們就用t變量作為它們的替代變量。此時,我們假定這個無法測定的變量是時間變量t的函數。
在本例中,我們用時間變量t代表所有除能源消費量外影響經濟增長的因素,設定其他影響因素是時間變量t的函數。
利用表3.4中的數據,設定t=1,2,……,15,使用普通最小二乘法,得到回歸模型

對比式(3.85)和式(3.96)可知:
(1)一元回歸模型中,能源消費量每增加1%,GDP平均增長2306.05億元。而在引入時間變量t的多元回歸模型中,能源消費量每增加1%,GDP平均增長574.71億元。一元回歸模型中由于設定偏誤,高估了能源消費量對經濟增長的影響。由于遺漏了時間趨勢變量,能源消費量就承擔了遺漏變量對GDP的影響,因而無法準確測定能源消費量對GDP的真實影響。
(2)兩個模型的標準誤也是不同的。
(3)多元回歸模型中擬合優度要優于一元回歸模型。
由此可見,如果在回歸分析中遺漏了重要解釋變量,將會帶來較嚴重的后果。所以在建立回歸分析模型時,就必須深入了解建模的有關經濟理論,將影響被解釋變量的重要變量引入到回歸模型中。
四、回歸模型的函數形式設定偏誤
如果回歸模型的函數形式設定有誤也會產生設定誤差。
經濟理論只能告訴我們經濟系統中各經濟變量之間的相互關聯性,并不能闡明變量之間關聯的函數形式。
例如,使用生產函數時,根據經濟理論我們只能知道產出是投入要素的函數,并未告訴我們具體的函數形式。我們可以用線性函數也可以用對數線性函數去研究它:

式(3.97)中β2,β3為斜率;式(3.98)中α2,α3為彈性,兩者意義不同。在線性函數中,彈性為β2(X2/Y),β3(X3/Y),是一個變彈性模型,而式(3.98)的彈性α2,α3為常數,是一個不變彈性模型。只有選擇了正確的函數形式,才能得到有效估計和正確的經濟解釋。
為了研究的方便,我們通常將非線性模型用線性模型去近似表達,這種近似必然存在誤差,從而影響參數估計的效果。
例如,當變量真實關系為多項式模型:

而我們在研究中使用了線性模型

則線性模型(3.100)中,遺漏了變量X2和X3,且遺漏變量與X相關,用普通最小二乘法估計參數是有偏誤的。
函數形式的設定偏誤有多種多樣,我們在選擇模型的函數形式時必須謹慎小心,而這又是一個探索和改進的過程,我們只能通過不斷的嘗試來找到最恰當的函數形式。
- 新形勢下中國投入產出核算的變革與實踐
- 自愿審計動機與質量研究:基于我國中期財務報告審計的經驗證據
- Splunk:Enterprise Operational Intelligence Delivered
- Learning Informatica PowerCenter 9.x
- 財務建模與綜合估值:數據研磨、模型校準、動態估值
- 新編統計學
- 成功通過PMP(第3版)
- 企業并購審查中的相關市場界定:理論與案例
- Minitab Cookbook
- 公司內部審計
- 政策建模技術:CGE模型的理論與實現
- 內部審計情景案例:理解審計行為,辨析審計決策
- 統計學理論前沿(谷臻小簡·AI導讀版)
- 效益實現管理實踐指南
- 多項目管理方法及其應用研究(國家社科基金后期資助項目)