官术网_书友最值得收藏!

§2.4 置信區間與假設檢驗

一、置信區間的基本概念

在例2.1的消費模型中,邊際消費傾向β2的估計值為0.7616,這是對未知的總體邊際消費傾向的一個點估計。由于是點估計,我們無法判斷這種估計的可靠性有多大。我們只能保證在重復抽樣中估計值的均值等于其真值。為了衡量這一估計的可靠性,我們可圍繞點估計量構造一個區間。要判斷對β2估計的可靠性,可設定區間[-δ,+δ],使其包含β2的概率為1-α,即

其中0<α<1,0<δ。如果存在這樣一個區間,就稱設定的區間為β2的置信區間。1-α稱為置信系數或置信水平,而α稱為顯著性水平。+δ稱為置信上限,-δ稱為置信下限。

如果α=0.05(5%),則式(2.51)的意義即為隨機區間[-δ,+δ]包含真實β2的概率為0.95(95%)。可以看出,置信區間給出了對β2估計的可靠程度。為了正確理解式(2.51),作如下說明:

(1)式(2.51)并不是說β2落入該界限內的概率是1-α。因為β2雖然未知,但它是總體回歸函數中的邊際消費傾向,是個定數,要么落在該區間內,要么落在該區間外。式(2.51)的意義為:用隨機樣本估計參數構造的區間包含β2的概率為1-α。

(2)式(2.51)中的區間是一個隨機區間,它隨著樣本的不同而不同。

(3)式(2.51)的意義為,對于多次抽樣,平均地說,這些區間有100%(1-α)包含真實參數β2.

(4)式(2.51)中,當是一個隨機變量時,代表多種可能結果。如果選定了一個樣本,就獲得的一個結果值,式(2.51)的區間就不再是隨機區間,而是特定區間。此時,我們就不能說這個給定的區間包含真實參數β2的概率是1-α。此時,β2要么在該區間內,要么在該區間外,概率只能是1或0。如果我們得到了β2的95%置信區間為(0.4≤β2≤0.7),就不能說這個區間包含真實值β2的概率是95%。這個概率不是1就是0。

二、ui正態性假定及普通最小二乘估計量的性質

1.ui正態性假定

在回歸分析中,我們的目的不僅僅是得到,而是要用推斷βj。因此,我們需要得到βj的置信區間,通過置信區間去判斷這種推斷的可靠性。在最小二乘估計式中,是Yi線性函數,從而也就是ui的線性函數。要推斷βj的置信區間,我們就必須獲得ui的概率布。在回歸分析中,人們常常假定u服從正態分布,即每個u都是正態分布的,亦即,

用符號表示為

其中“~”表示“其分布為”,N表示“正態分布”,括號中的數字為正態分布的兩個參數:期望值和方差。

我們假定ui服從正態分布的理由如下:

(1)ui代表回歸模型中未包含的變量的集合。這些未引入的變量的影響是微弱的和隨機的。根據中心極限定理,如果存在大量獨立且同分布的隨機變量,隨著這些變量個數的增大,它們的總和將趨向正態分布。

(2)即使變量個數不是很大或這些變量不是嚴格獨立的,它們的總和仍可視同正態分布。

2.ui正態假定下普通最小二乘估計量的性質

(1)它們是無偏的。

(2)它們有最小方差。

(3)它們是一致估計量。也就是說,隨著樣本容量無限地增大,估計量將收斂到它們的真值。

(4)服從正態分布,即

(5)服從正態分布,即

(6)(n-2)2服從χ2(n-2)分布。

(7)Yi服從正態分布:

三、回歸系數β1和β2的置信區間

在ui正態假定下,均服從正態分布,將轉化為標準正態分布,則為

Z為期望值為0、方差為1的標準正態分布,即

當σ2已知時,我們就可得到β2的置信度為1-α的置信區間為

但是,由于ui的不可觀測,我們無法獲知σ2。我們只能用σ2的無偏估計量來測定σ2,如果我們用代替σ2,則(2.65)式可寫為

可以證明,這樣定義的t變量服從自由度為n-2的t分布,據t分布可得

式(2.68)中,tα/2是顯著性水平為α/2,自由度為n-2的t分布的t值,通常稱為α/2顯著水平的臨界值。將式(2.67)代入式(2.68)得

整理可得

式(2.70)給出了β2的一個100(1-α)%的置信區間。

同理我們可得到β1的置信區間:

從式(2.70)和(2.71)可以看出,β1,β2的置信區間的寬度與估計量的標準誤se(),se()成正比例。標準誤越大,置信區間越寬。就是說,估計量的標準誤越大,對未知參數的真值進行估計的可靠性越差。因此,估計量的標準誤也被用于測度估計量的精度,也就是說用估計量去測定真實的總體值有多精確。

例如,在例2.1中我們得到斜率系數的估計值=0.7616,se()=0.0149,自由度為8,當顯著性水平為5%,即置信系數為95%時,查t分布表可知tα/2(8)=t 0.025(8)=2.306,則β2的95%置信區間為

式(2.72)的意義為:給定置信系數為95%,從長遠看,類似于(0.7272,0.7960)的區間,100個區間中,將有95個包含著真實的β2值。我們不能說這個固定的區間有95%的概率包含真實的β2值,因為這個區間是固定不變的,β2要么在該區間內,要么在該區間外。這個固定的區間包含β2的概率要么為1,要么為0。

同理,我們可構建β1的置信區間為

式(2.73)表示,從長遠看,該區間100個中將有95個包含真實的β1。但這個固定的區間包含真實的β1的概率是1或0。

四、假設檢驗

1.檢驗回歸系數的顯著性——t檢驗

統計假設檢驗的中心思想就是判斷某一特定觀測或發現是否與某一聲稱的假設相符。如果相符就不拒絕這一假設,如不相符就拒絕這一假設。例如,在引例的回歸分析中,如果事先我們已有一些研究成果認定邊際消費傾向β2為0.9,那么β2=0.9就是我們所說的聲稱的假設。如果我們的觀測(估計)結果=0.7616在一定的統計原則下與0.9并不矛盾,我們就接受假設β2=0.9,即邊際消費傾向的真值為0.9。如果,=0.7616與β2=0.9在一定的統計原則下相互矛盾,我們就拒絕假設β2=0.9,即邊際消費傾向的真實值不是0.9。我們稱β2=0.9這一聲稱的假設為虛擬假設或原假設,用符號H0表示;與之相對應β2≠0.9就稱為備擇假設,用符號H1表示。

一般地,可假設為

已知:

即t服從自由度為n-2的t分布。如原假設成立,即β2*,則據(2.74)式和已知樣本算得t值為

該t值是一個統計量,服從t分布,據此可得到t統計量的置信區間

式(2.76)建立的100(1-α)%置信區間為原假設H0:β2*的接受域,置信區間以外的區域稱為原假設H0:β2*的拒絕域。

例如,在引例中的收入-消費模型中,=0.7616,se()=0.0149,自由度=8,取α=5%,查t分布表可知tα/2=2.306.若H0:β2*2=0.9,H1:β2≠0.9,則

因為

所得的t統計量不在(2.77)式的區間內,故拒絕原假設H0:β2=0.9,接受備擇假設H1:β2≠0.9,如圖2.6所示。

圖2.6 t的95%置信區間(自由度=8)

如果式(2.75)中的*,則t統計量為0。可以看出,隨著估計值遠離β*,t的絕對值|t|將越來越大。就是說,隨著t統計量的絕對值的增大,原假設的可信程度在降低。當t統計量的絕對值大于臨界值tα/2時,就拒絕原假設。臨界值tα/2來自于t分布表,其數值的大小決定于自由度n-k和我們愿接受的第I類錯誤(即H0為真時拒絕它)的概率。

因為我們使用了t分布對回歸系數進行假設檢驗,因此,該檢驗程序稱為t檢驗。如果一個統計量的值落在拒絕域上,我們稱該統計量是統計上顯著的,此時,我們拒絕原假設;如果一個統計量的值落在接受域上,我們稱該統計量是統計上不顯著的,此時,我們接受原假設。

在計量經濟分析中,Yi12Xi+ui,其中β2代表解釋變量X對被解釋變量Y的線性影響。如果X對Y的線性影響是顯著的,則有β2≠0。若X對Y的影響不顯著,則有β2=0。因此,我們通常設定的假設為

此時,我們得到t統計量為

給定顯著水平α=5%,自由度為n-k,查t分布表可得臨界值為tα/2,如果|t|<tα/2,則接受原假設H0:β2=0,即解釋變量X對被解釋變量Y的影響是不顯著的,解釋變量對被解釋變量沒有影響,該解釋變量不應包含在模型中。如果|t|>tα/2,則拒絕原假設H0:β2=0,接受備擇假設H1:β2≠0,即解釋變量X對被解釋變量Y的影響是顯著的,該解釋變量應該保留在模型中。

對于截距項β1,除非有理論上的特別意義或者要進行經濟預測,通常即使是不顯著,也可不理會。

t檢驗決策規則:

(1)設定假設:原假設H0:βj=0,備擇假設H1:βj≠0

(2)計算原假設H0:βj=0條件下的t統計量

(3)在給定顯著性水平α的條件下,查t分布表得臨界值tα/2(n-k)

(4)判斷:

如果|t|>tα/2(n-k),則拒絕原假設H0:βj=0,接受備擇假設H1:βj≠0;

如果|t|<tα/2(n-k),則不拒絕原假設H0:βj=0。

在引例的收入-消費模型中,假設為H0:β2=0和H1:β2≠0。回歸系數的t統計量為

由于t=51.1141>2.306,拒絕原假設H0,接受備擇假設H1,即解釋變量X對被解釋變量Y的影響是顯著的,回歸系數β2通過t檢驗。

2.t檢驗的相關問題

(1)顯著性水平α

臨界值tα/2的大小取決于顯著性水平α,即犯第I類錯誤的概率(錯誤地拒絕了真實的原假設的概率)。α越小,臨界值tα/2越大,犯第I類錯誤的概率越小。

例如,我們把顯著性水平由5%降為1%,則β2的置信系數由95%升為99%。因此,犯第I類錯誤(錯誤地拒絕為真的原假設)的概率由5%降到至1%,但同時犯第Ⅱ類錯誤(錯誤地接受為假的原假設)的概率卻上升了。因此,選擇顯著性水平時,要根據兩類錯誤的代價而定,兩類錯誤的代價是隨著實際問題而異的。在計量經濟分析中,通常會選擇相當小的顯著性水平,即把犯第I類錯誤的概率控制在較低水平。顯著性水平通常在抽樣前確定,一般取值為0.10,0.05,0.01。

(2)實際顯著水平——p值

一般計量經濟分析中,都使用事先給定的顯著性水平。當我們對給定的樣本算出一個檢驗統計量(如t統計量)的值后,就可根據相應的統計表,獲知等于或大于該統計量的概率,我們稱其為p值。例如,當估計值為時,t統計量則其伴隨概率p值p值是假設檢驗中的實際顯著性水平或犯第Ⅰ類錯誤的實際概率。更確切地講,p值是一個虛擬假設被拒絕的最低顯著性水平。例如,在引例的收入-消費模型中,的t統計量值分別為3.021和51.135。實際顯著性水平都小于5%,t=3.021對應的p值為0.0165,即實際顯著性水平僅僅為1.65%,而t=51.135對應顯著性水平小于萬分之一(在EViews中以0.0000顯示其值)。所測的t統計量的p值比1%要小得多,就是說,我們如果根據t=51.135這個統計量值拒絕H0:β2=0的虛擬假設,那么犯第Ⅰ類錯誤的概率要小于0.01%,即小于萬分之一。

p值度量的是犯第Ⅰ類錯誤的概率,即拒絕正確的原假設的概率。p值越大,錯誤地拒絕原假設的可能性就越大;p值越小,拒絕原假設時就越放心。

因此,可以通過p值比較進行假設檢驗。當p<α時,|t|>tα/2(n-k),拒絕原假設H0:βj=0,接受備擇假設H1:βj≠0;當p>α時,|t|<tα/2(n-k),則不拒絕原假設H0:βj=0.

(3)“2倍t”和“5%p值”簡算法

當樣本容量n較大時(n≥30),t值只要大于2.0,我們就將回歸系數判定為顯著的。當進行多元回歸時,回歸系數較多,利用這種方法非常方便,不需查t分布表。因為通常在5%的顯著水平下,如果自由度在28以上(一元回歸中的n≥30),則t分布表中的臨界值tα/2,按四舍五入的原則,全部等于2.0。同樣,在5%的顯著性水平下,無論樣本容量多大,當p值小于5%時,即p<0.05時,我們就可判定回歸系數是顯著的。

如果顯著性水平不是5%或樣本較小,則回歸系數的顯著性檢驗的臨界值就需據t分布表來確定,而不能使用2或5%做臨界水平進行t檢驗。例如,在引例的收入-消費模型中,雖然的t值分別為3.021,51.135,都大于2,但樣本較小,不能直接判定是顯著的。的p值分別為0.0165,0.0000,均小于5%,如果顯著性水平α=5%可判定都是顯著的。

主站蜘蛛池模板: 布尔津县| 丹凤县| 缙云县| 桓台县| 扶余县| 浑源县| 宣汉县| 台安县| 衡山县| 商洛市| 伊春市| 衡阳市| 吴忠市| 崇义县| 光山县| 小金县| 育儿| 克东县| 泉州市| 新丰县| 措美县| 黎平县| 蒲城县| 萨迦县| 天峨县| 东兴市| 龙川县| 青神县| 衡南县| 长沙市| 新蔡县| 穆棱市| 兰州市| 邵阳市| 宁安市| 建水县| 上思县| 时尚| 赤水市| 兰溪市| 城步|