官术网_书友最值得收藏!

2.7 廣義矩估計

在實證資產定價研究中,除了多因子模型外,還有很多其他的模型。其中一個重要的模型是由Lucas(1978)和Breeden(1979)提出的基于消費的資產定價模型(Consumptionbased CAPM,CCAPM)。CCAPM的理論雖然優(yōu)雅,但是模型中消費和資產收益率之間的關系是非線性的,傳統(tǒng)的統(tǒng)計學方法在檢驗該模型時無能為力。在學術界為如何檢驗CCAPM絞盡腦汁的時候,Hansen(1982)提出了廣義矩估計(Generalized Method of Moments,GMM)[1]

GMM是一個非常強大的計量經濟學方法,在實證資產定價研究的歷史上起到了舉足輕重的作用。而如今無論是在經濟學領域還是金融學領域,GMM因其數學上的優(yōu)雅和特性上的強大而被廣泛運用,Hansen(1982)也早已成為計量經濟學領域被引用量最高的文章之一。雖然GMM最初是被用來檢驗CCAPM的,但其強大的性能和“標準化”的使用流程使得它可以被方便地應用于檢驗線性多因子模型(Cochrane 2005的第13章對此有精彩的論述)。為此,作為因子投資方法論章節(jié)中的進階內容,本節(jié)對GMM進行介紹。筆者相信,掌握GMM將會幫助讀者在未來進行更深入的因子投資研究。

本節(jié)的目標是從直觀出發(fā)揭示GMM蘊含的數學之美。以下行文中試圖把公式掰開揉碎講清楚,從而幫助感興趣的讀者理解復雜公式背后的本質。Cochrane(2005)指出,學習GMM時最大的障礙就是涉及的數學符號繁多。只要搞清楚這些符號,GMM背后的數學精髓其實是非常簡單的,因為GMM的核心最終能夠歸結為計算樣本均值的方差(the variance of the sample mean)。希望本節(jié)的論述能帶給你這種恍然大悟之感。接下來就從樣本均值的方差說起。

2.7.1 樣本均值的方差

考慮某隨機變量ut。假設它在某個樣本內的取值為0、-1、3、3、-3。式(2.99)計算出了ut的樣本均值ū

ū=ET[ut]=0.4 (2.99)

由于ut是一個隨機變量,因此其樣本均值ū也是一個隨機變量。雖然它在上述樣本中的取值為0.4,但假如能夠乘坐時光機回到過去“重寫歷史”,得到不同的樣本,那么在不同的樣本中,樣本均值的取值也會有所變化。假設除樣本一(就是上面這個樣本)之外,還有三個樣本。每個樣本中的ut和它們的樣本均值ū如表2.5所示。

表2.5 多個樣本

既然樣本均值本身也是一個隨機變量,那么一個很自然的問題就是樣本均值在不同的樣本中是如何變化的,即求解樣本均值的方差。從方差的定義出發(fā)有:

式中T為樣本量。在最簡單的情況中,假設ut序列滿足獨立同分布,則式(2.100)可以簡化成:

將式(2.101)兩邊開方就得到樣本均值的標準誤:

式(2.102)的結果大概是各位讀者在統(tǒng)計課中學到的印象最深的一個式子——當ut滿足獨立同分布時,樣本均值的標準誤。對于金融數據(比如收益率)來說,ut序列有非零的自相關性(即cov(ut, ut?j)≠0),難以滿足獨立同分布,因此需要得到更一般情況下樣本均值ū的方差:

T趨于無窮大時,(T-j)/T趨于1,可以求出var(ū)的漸進形式:

下面再假設一個特殊的情況,即隨機變量ut的總體均值E[ut]=0,并利用方差運算的性質var(X, Y)=E[XY]-E[X]E[Y]可得:

上式最后一項中使用S代表了中間項中的求和項。在GMM的術語中,S被稱作ut的譜密度矩陣。以上從人們熟悉的樣本均值出發(fā)指出樣本均值本身也是一個隨機變量,并推導出當樣本量T趨于無窮,且假設E[ut]=0時,樣本均值的方差漸進趨于S/T,其中S是無窮級數求和∑E[utut?j]。千萬不要小看var(ū)→S/T這個式子,它在下文中介紹GMM的數學推導中起著至關重要的作用。

2.7.2 分析框架

回顧了樣本均值的方差之后,本節(jié)就來解釋GMM到底是怎么回事兒。GMM的作用是為了檢驗模型,比如模型到底對不對?模型的參數如何估計?誤差是來自運氣還是因為模型有誤?GMM提供了一個優(yōu)雅而強大的計量經濟學框架來回答這些問題。一般來說,GMM框架分為以下三個部分。

? 第一部分:把關注的問題表達成一系列總體矩條件,即提出模型。

? 第二部分:使用樣本數據得到對應的樣本矩條件,從而對參數進行估計,即把模型和數據聯(lián)系起來。

? 第三部分:計算參數的標準誤(方差),并進行統(tǒng)計檢驗,即檢驗模型。

1. GMM第一部分

在接下來的討論中,令xt代表數據,b代表參數(它們都是向量)。在使用GMM時,將猜想的模型描述成一組關于xtb的函數fxt, b),且當b=b0時如下的矩條件成立:

E[fxt, b0)]=0 (2.106)

式(2.106)左側的E[fxt, b0)]是總體矩(population moments),而約束(2.106)就是總體矩條件(population moment conditions)。它們表示當猜測的模型正確時,參數和數據應該滿足的關系,因此它們就是待檢驗的原假設。需要說明的是,期望符號E表示對總體求均值;而前面使用的(接下來也將會繼續(xù)使用的)期望符號ET表示對樣本求均值。GMM的第一部分是把研究的問題轉化成數據和參數的一組矩條件E[fxt, b0)]=0。

為了加深理解,來看資產定價中的例子。Cochrane(2005)指出資產定價理論都可以歸結到一個最基礎的式子[2]

pt=E[mt+1xt+1] (2.107)

其中m是隨機折現因子(stochastic discount factor,由參數b0決定),xt+1是某個投資未來的回報,pt是該投資現在的價格。因此這個式子說明某個投資未來的回報的現值等于今天的價格。舉例來說,令代表無風險資產的總回報,即t期投入pt=1,t+1期得到。將它們代入式(2.107)就得到一個矩條件:

又比如,對于某個通過多空對沖構成的資金中性投資組合(如某個因子或者異象的投資組合),其理論上是靠賣空的資產獲得的資金來買入做多的資產,因此該組合的成本是零,即pt=0。令Re代表該組合的超額收益,即xt+1=Re。將它們代入式(2.107)就得到另一個矩條件:

E[mb0Re]=0 (2.109)

式(2.108)和式(2.109)都是資產定價中常見的總體矩條件。將它們放在一起就得到向量的形式:

2. GMM第二部分

GMM的第一部分通過總體矩條件描述了關注的問題,但這些矩條件僅僅是人們對于真實模型的猜想,而人們手里有的只是樣本數據。因此,GMM的第二部分就是用樣本矩(sample moments)代替總體矩,從而建立起模型和數據之間的聯(lián)系,以此進行參數估計和檢驗。根據定義,樣本矩可以寫成:

上式最后一項中引入符號gT僅僅是為了在下文中簡化公式。怎么樣?看著式(2.111)有沒有什么感想?無論研究的具體問題是什么(比如本書中的實證資產定價,而別人也可以研究經濟學或金融學中其他的問題),不管一系列函數f的具體形式長什么樣,式(2.111)中的樣本矩在數學上的定義都是f在樣本內取均值而已,因此它也是一種樣本均值。

從樣本矩出發(fā)就可以進行參數估計。GMM的第一步提出模型時假設總體矩滿足矩條件E[fxt, b0)]=0(原假設)。如果原假設成立,那么樣本矩在統(tǒng)計上不應顯著偏離零。使用樣本數據,GMM的核心是找到參數b0的估計,以使所有樣本矩都盡可能地等于零:

式(2.112)中之所以用了約等于而非等于,是因為在實際問題中,樣本矩的個數往往超過參數的個數(這也被稱為過度識別,overidentification)。假設問題中一共有n個矩(即gTn維向量),p個參數(即b0p維向量)。當n>p時,顯然無法讓所有的樣本矩都等于零,因而選擇讓這其中的p個樣本矩或者所有樣本矩的p個線性組合等于0。這就是GMM估計量:

上式中a是一個p×n階矩陣,每一行都代表一個樣本矩的線性組合。為了便于理解,仍然用資產定價來舉例子。假設CCAPM是正確的資產定價模型。在CCAPM下,隨機折現因子m由兩個參數b1b2決定,即b0=[b1, b2]′。接下來,假設使用以下四個資產構造四個矩條件來檢驗CCAPM。這些資產是市場組合、無風險資產,以及Fama and French(1993)中的價值(HML)和規(guī)模(SMB)兩個因子的投資組合。用表示無風險資產的總回報,用代表其他三個資產的超額收益。在這個例子中,n=4而p=2,因此a是一個2×4矩陣,而GMM估計可以寫成:

根據式(2.114)就可以使用樣本矩求出參數估計。不過有的讀者會有疑惑,因為式(2.114)中并沒有說明矩條件的線性組合矩陣a是什么。不同的a顯然會得到不同的參數估計。GMM的框架下允許人們任意選擇a,然而從計量經濟學的角度,有一個特殊的矩陣a會讓GMM估計量成為有效估計量(efficient estimator)。

3. GMM第三部分

使用GMM估計得到的僅僅是真實但未知參數b的一個估計。從統(tǒng)計學的角度看,人們同樣關心估計的誤差,即。對于給定的樣本矩gT,從計量經濟學的角度看有一個特殊的矩陣a使得最小,這就是有效(efficient)的含義。Hansen(1982)給出了這個a的形式,2.7.4節(jié)將對它的含義以及GMM估計的有效性做進一步探討。

的大小僅僅說明參數估計是否準確,而對于研究的問題來說,人們更加關注的是當給定的大小。在一般的過度識別問題下(即矩個數多于參數個數),樣本矩無法全都滿足等于零的矩條件[3],因此需要回答的問題是樣本矩聯(lián)合起來相對于零的偏離的大小,并搞清楚樣本矩聯(lián)合起來相對于零的偏離是因為運氣成分還是因為選擇的總體矩條件(即原假設)是錯的。如果僅僅因為運氣(即偏離很小),那么可以接受原假設——比如接受一個資產定價模型;如果不是因為運氣(即偏離很大),就只能拒絕原假設。唯有有了,才能夠進行統(tǒng)計檢驗并決定接受或拒絕原假設。計算并進行統(tǒng)計檢驗就是GMM的第三部分。

Hansen(1982)中的定理3.1指出,當樣本量T趨于無窮大時,滿足以下漸進正態(tài)性:

式中-1表示求逆,′表示轉置,所以(ad?1′表示先求ad的逆矩陣,再轉置。Hansen(1982)給出了漸進分布成立需要滿足的一系列假設。在實際應用中,應牢記的是數據xt需要滿足弱平穩(wěn)性,這是因為GMM的基礎是隨著T的增大,樣本均值向總體均值收斂。

此外,Hansen(1982)中的引理4.1指出滿足如下漸進正態(tài)性:

式中In階單位陣。式(2.115)和式(2.116)中的a就是樣本矩的線性組合權重矩陣,但以上還未說明dS是什么。接下來2.7.3節(jié)會把它們的含義說清楚。式(2.115)和式(2.116)中正態(tài)分布的方差的表達式看似無比復雜,但它們本質上也都離不開2.7.1節(jié)介紹的樣本均值的方差。

一旦有了的分布,便可以對GMM第一部分中提出的模型進行檢驗,從而決定是接受還是拒絕它。以資產定價為例,矩條件代表了給定定價模型下不同資產或投資組合的定價誤差α,人們關心這些定價誤差聯(lián)合起來是否為零。有了樣本矩的分布,可以構建相應的檢驗統(tǒng)計量。如果檢驗統(tǒng)計量超過給定顯著性水平的閾值,就可以拒絕該資產定價模型。

總結一下,本節(jié)介紹了GMM的三個部分,其中:

? 第一部分把關心的問題表述成一組總體矩條件;

? 第二部分用樣本矩代替總體矩從而把樣本數據和模型聯(lián)系起來,并進行參數估計;

? 第三部分計算,并進行統(tǒng)計檢驗,決定是否接受第一部分提出的模型。

2.7.3 數學基礎

本節(jié)的目標是解釋如何計算。了解本節(jié)的內容可以更好地理解GMM背后的數學之美。先說式(2.115)和式(2.116)中的S,這是核心。首先回顧一下gT的定義(式(2.111)):

gT求方差就得到var(gT)。由gT的定義可知,無論函數f長什么樣子,樣本矩gT的數學形式都僅僅取平均,即gT其實就是fxt, b0)的樣本均值,因此var(gTb0))就是對一個樣本均值求方差,即樣本均值的方差。利用2.7.1節(jié)的式(2.105)可以很容易推導出,當T趨于無窮時的var(gT):

利用式(2.117),定義S如下:

它是一個n階矩陣(在實際情況中,它可以用樣本數據來估計)。式(2.117)的計算中之所以能把方差和協(xié)方差寫成E[XY]的形式,是因為原假設下的總體矩條件約束E[fxt, b0)]=0這里預期符號E沒有下標T,表示總體期望。

需要強調的是,式(2.117)給出的是var(gTb0)),即樣本矩gT在真實參數b0下的方差。而為了檢驗模型,人們關心的是gT在估計。然而,一旦有了var(gTb0))=S/T,計算就變得容易了。首先看看如何計算。將b=b0中進行一階泰勒展開:

式中一階偏導數?gTb0)/?b′的分母中?b右上角有一個轉置符號。在計算偏導數時,gT是一個n維向量(n個矩),而b是一個p維向量(p個參數),因此偏導數運算將會得到一個矩陣,這類運算屬于矩陣微積分(matrix calculus)。當轉置符號出現在分母時,得到的偏導數矩陣是n×p矩陣,即每一行代表一個矩,這種排列方式被稱作分子布局(numerator layout)或雅可比布局(Jacobian formulation)。

接下來,定義矩陣d如下:

式中第一個等價符號是d的定義,而第二個等式意味著在實際應用中用樣本矩和來計算d(Cochrane 2005)。Hansen(1982)指出,當T趨于無窮大時,依概率收斂于E[?fxt, b0)/?b′]。這個一階偏導數矩陣正是式(2.115)和式(2.116)中的d。用d代替?gTb0)/?b′代入式(2.119)并進行簡單的代數運算:

對上式的兩邊直接求方差就可以得到。值得一提的是,式(2.121)右側的(ad?1a是系數矩陣,而gTb0)的方差已由式(2.117)給出了——正是S/T。因此有:

下面如法炮制,通過一階泰勒展開,利用var(gTb0))求解

由于已經在式(2.121)中求出,因此只需把它代入式(2.123)就可得到:

兩邊同時求方差得到

上式中的第二個等式仍然利用了var(gTb0))=S/T這一結果。式(2.125)表明,其實是var(gTb0))乘以某個系數矩陣得到的,這個系數矩陣是單位陣I減去dad?1a。從直覺上說,gTgTb=b0時的方差var(gTb0))要小。這是因為在GMM估計時用到了樣本矩gTp個線性組合,并令它們等于零——=0——從而求出的的過程中,這些約束條件“消耗”掉了樣本矩的一些變化,導致

無?論是求解,式(2.119)和式(2.123)中的一階泰勒展開操作雖然非常“熱鬧”,但它們其實都僅用了統(tǒng)計學中的delta方法(delta method)。因此,雖然公式看似復雜,但是它們實質上只是利用了樣本均值的方差(S/T)和delta方法而已!就是這么簡單。有了,就可以得到樣本矩的漸近分布式(2.116)。

下面回到GMM關注的問題:檢驗模型。如果原假設成立,那么樣本矩聯(lián)合起來不應該顯著地偏離零。這可以通過構建如下的χ2-統(tǒng)計量進行檢驗:

將式(2.125)中的表達式代入式(2.126)最終得到:

其中χ2-統(tǒng)計量的自由度是用矩的個數減去參數的個數,即n-p,這是因為在計算的時候用掉了p個自由度。同時,這也意味著不是滿秩的,因此式(2.127)中對其求逆實際上是在計算它的偽逆矩陣(pseudo-inverse)。

總結一下本節(jié)。以上用了大量的文字和推導把背后的數學含義呈現給讀者,是希望這個過程能幫助各位加深對GMM的理解。站在數學符號的角度來說,雖然這些公式看上去很復雜(又是轉置、又是求逆),但當使用GMM時,只需提供它需要的矩陣a、樣本矩條件gT及矩陣dS,剩下的“無腦”交給GMM就可以計算出各種想要的統(tǒng)計量并進行檢驗,非常方便。如今,各種編程語言的統(tǒng)計包更是能夠方面地實施GMM。

2.7.4 有效性

2.7.2節(jié)曾給出了GMM估計量如下:

其中ap×n矩陣,每一行都代表樣本矩的某個線性組合。本節(jié)關心的問題是,如何選取矩陣a?回答這個問題應從業(yè)務和統(tǒng)計兩方面思考。從金融學原理出發(fā),尤其是針對資產定價問題,可以選擇一些業(yè)務含義最重要的矩,讓它們或它們的線性組合等于零。另外,單從統(tǒng)計上說,Hansen(1982)給出了一個特殊的a,它能確保得到的GMM估計量是有效的(efficient GMM estimator),即在給定的樣本矩gT下,該特殊的a使得最小。這個特殊的a為:

a=d′S?1 (2.128)

這個a到底有沒有什么更直觀的含義?別急,先來驗證一下a的階數。由d的定義式(2.120)可知,它是一階偏導數矩陣,且在計算時遵循分子布局。由此可知,d的階數是n×p,而d的轉置d′就是p×n矩陣。事實上,d′同樣也是一階偏導數矩陣,只不過這次轉置運算出現在分子上,即。它的運算則遵循的是分母布局(denominator layout)或黑塞布局(Hessian formulation),通常表示求梯度(gradient)。此外,由S的定義式(2.118)可知它是n階矩陣。因此由a=d′S?1可知a的階數確實是p×n

下面就來看看a=d′S?1的含義。為了解釋它,就不得不提GMM估計量的另一個表達式:

式中W是半正定權重矩陣(weighting matrix)。式(2.129)的含義是,在過度識別問題中,既然無法讓所有的樣本矩gT都等于零,那么就讓這ngT的范數的加權之和盡可能地接近零,以此來確定。正如可以在式(2.113)中隨意選擇矩陣a一樣,在式(2.129)中可以隨意選擇權重矩陣W。然而,從估計量的有效性來說,最優(yōu)的權重矩陣滿足W=S?1。這從統(tǒng)計上非常好理解:對于一組矩gT,人們希望它們(非負)加權之和最接近零。使用W=S?1S的逆矩陣(別忘了S/T是var(gTb0)))相當于給誤差大的矩更低的權重、給誤差小的矩更高的權重。換句話說,人們更愿意相信那些誤差小的矩并使用它們來得到盡可能準確的參數估計最低,這也就是“有效”的含義。將W=S?1代入式(2.129)并求其一階條件有:

怎么樣,看著眼熟不?式(2.130)中括號里的第一項正是d的轉置d′,第二項是S?1。這兩項放一起d′S?1正是特殊的a的表達式(2.128)。由此也可以推導出式(2.113)和式(2.129)這兩種GMM估計量表達式的關系:

GMM估計量式(2.129),令

上述推導說明這兩種GMM估計量表達式是等價的。無論如何選取權重矩陣W,都有一個與之對應的a=dW矩陣。當矩陣a或權重矩陣W取統(tǒng)計上最優(yōu)時,以及χ2-統(tǒng)計量的表達式均可以大大化簡。Hansen(1982)給出了它們的形式:

需要強調的是,上述簡化后的表達式只有當a=dS?1W=S?1時才成立。如果aW取別的值,則需使用2.7.3節(jié)中相應的公式。很多關于GMM的資料中默認W=S?1,并給出了這些統(tǒng)計量的簡化形式,在使用時應搞清楚前提條件。

在實際估計中,一方面必須先有才能估計S,并計算W=S?1(或最優(yōu)的a);但另一方面只有使用S?1才能得到有效估計。這似乎又是一個“雞生蛋、蛋生雞”的問題,在實際中往往采用兩階段法:(1)第一階段取W=I單位陣,估計出;(2)第二階段使用上述估計S,令W=S?1進行再一次估計得到新的。當然,如果愿意,使用者也可以把上面的第二階段迭代多次,得到最終的。以上就完成了關于GMM的全部介紹。

2.7.5 不應成為黑箱

GMM如此強大,再加上現在各種編程語言(R、Stata等)都能方便地計算,這種便捷性似乎把人們都慣壞了。人們習慣于把問題描述成矩條件后一股腦塞進GMM并僅從統(tǒng)計的角度選擇W=S?1得到有效估計。這么做十分危險。GMM的強大之處在于它不僅僅是一個計量經濟學工具能用來做檢驗,更重要的是它足夠靈活從而可以讓人們研究真正關心的經濟學或金融學問題。這種靈活性體現為可以從先驗出發(fā)去定義最適合待研究問題的矩陣a(或W),而不是無條件地選擇W=S?1

以2.7.2節(jié)中資產定價的例子來說,它有4個矩和2個參數,待檢驗的模型是CCAPM。從經濟學業(yè)務出發(fā)可以選擇如下的

在選擇矩陣a時,令市場超額收益和無風險資產完美滿足兩個樣本矩條件,并由此進行CCAPM的參數估計,求出兩個參數。同時,使用另外兩個資產的超額收益來檢驗CCAPM。由GMM框架可知,最終的χ2-統(tǒng)計量的自由度為2(因為一共4個資產,2個被用來估計參數),因此實際上的檢驗正是HML和SMB兩個因子在CCAPM下的定價誤差聯(lián)合起來是否顯著偏離零,從而判斷接受或拒絕CCAPM。這個例子說明,從金融學原理出發(fā)選擇合適的aW能夠回答最重要的問題。GMM的強大之處正在于此。

純從統(tǒng)計學的角度來說,選擇W=S?1確實能夠得到有效估計量。但不要忘記,這個有效性是以給定的樣本矩為前提的——如果換了或者添加了更多的矩,則參數的有效估計量也會發(fā)生變化。在金融市場中,有無數的資產,包括股票、債券、外匯、商品等,還有無數的投資組合,這些資產可以構成無數的矩。如果一味地追求有效性,則應把這成千上萬資產的矩都塞進GMM。但顯然,從業(yè)務的角度來說這么做毫無意義。在研究資產定價的時候,應該使用業(yè)務含義最重要的資產,并用它們去檢驗定價模型。毫無疑問,GMM非常強大,但在資產定價的研究中不應追求使用GMM進行一個僅在統(tǒng)計上正式但模型卻缺乏含義的統(tǒng)計檢驗。GMM的強大在于它讓人們從經濟學和金融學原理出發(fā),去找尋最合理的模型。不要讓GMM成為計量經濟學的黑箱。

[1]Lars Peter Hansen在提出GMM之后又對其進行了一系列必要的擴展,包括工具變量選擇(Hansen 1985)、連續(xù)時間模型(Hansen and Scheinkman 1995)、其他GMM估計量(Hansen et al.1996)以及非最優(yōu)權重矩陣下的GMM(Hansen and Jagannathan 1997)等。Hansen也因為這一系列突出貢獻,于2013年和Eugene Fama和Robert Shiller一起分享諾貝爾經濟學獎。

[2]關于這個式子的論述,詳見公眾號“川總寫量化”的文章《理解資產價格》以及本書附錄A。

[3]如果樣本矩的個數n等于參數個數p,則不存在過度識別問題,可以令所有矩都等于零從而求出全部p個參數。

主站蜘蛛池模板: 新余市| 浦江县| 扎赉特旗| 雅江县| 石林| 昌乐县| 开阳县| 石渠县| 乐平市| 麻栗坡县| 临泽县| 兴仁县| 长沙县| 新安县| 抚松县| 苏尼特右旗| 如东县| 大姚县| 台前县| 哈巴河县| 栖霞市| 韩城市| 开远市| 左权县| 梧州市| 积石山| 原阳县| 修文县| 沅江市| 浏阳市| 宜丰县| 朝阳区| 勃利县| 抚远县| 奉化市| 周口市| 大厂| 德清县| 普兰县| 瓮安县| 长春市|