- 肥尾效應(yīng)
- (美)納西姆·尼古拉斯·塔勒布
- 5446字
- 2022-09-02 10:35:00
2.2 一般&特殊概念目錄
下面是一些核心要點(diǎn)的定義(可能和后面存在重復(fù))。
2.2.1 冪律類分布
冪律類分布一般通過如下生存函數(shù)的性質(zhì)來定義。假設(shè)隨機(jī)變量X屬于右尾為“冪律”的分布類,也就是:

這里是緩變函數(shù),對于所有k>0,定義如下[22]:

變量X的生存函數(shù)屬于“正規(guī)變化”類RVα,具體來說,函數(shù)在無窮大處以指數(shù)ρ變化
:

更進(jìn)一步看,會存在一個點(diǎn),使得L(x)趨向于極限的時(shí)候?yàn)槌?shù)l,我們稱它為“卡拉瑪塔常數(shù)”(Karamata),該點(diǎn)也被稱為“卡拉瑪塔點(diǎn)”。在該值之外,冪律尾可以通過希爾估計(jì)這樣的標(biāo)準(zhǔn)方法來擬合。該區(qū)域內(nèi)的分布也被曼德博[162][75]稱為強(qiáng)帕累托法則。
對于分布左尾,上述規(guī)律類似。
2.2.2 大數(shù)定律(弱)
大數(shù)定律的標(biāo)準(zhǔn)形式如下,假設(shè)X1,X2…Xn是獨(dú)立同分布(i.i.d.)的無限序列(勒貝格可積),且(盡管有時(shí)可以放松獨(dú)立同分布條件)。樣本均值
會收斂到期望值,對于
這里方差有限并非必要條件(不過各高階矩的存在會加快收斂速度)。
強(qiáng)大數(shù)定律有需要時(shí)再做討論。
2.2.3 中心極限定理(CLT)
中心極限定理的標(biāo)準(zhǔn)形式(Lindeberg-Lévy)如下,假設(shè)有一系列獨(dú)立同分布的隨機(jī)變量,是n個樣本的均值,當(dāng)n趨于無窮時(shí),隨機(jī)變量的和
會收斂到高斯分布[20][21]。

這里收斂到分布的意思是,對于每一個實(shí)數(shù)z,的CDF(累積分布函數(shù))會點(diǎn)對點(diǎn)收斂到標(biāo)準(zhǔn)高斯分布的CDF,N(0,σ):

Φ(z)是z處標(biāo)準(zhǔn)高斯分布的CDF值。
中心極限定理還有很多其他版本,下面有需要時(shí)會展開論述。
2.2.4 中數(shù)定律和漸進(jìn)論
這是全書的主旨,我們想要了解隨機(jī)變量數(shù)目n比較大但又不是極大時(shí)的漸進(jìn)行為。對高斯分布來說,這不是什么大問題,因?yàn)槭諗克俣群芸欤ù髷?shù)定律和中心極限定理都是),但是對很多其他的隨機(jī)變量來說并非如此。
見下面的Kappa統(tǒng)計(jì)量。
2.2.5 Kappa統(tǒng)計(jì)量
這一統(tǒng)計(jì)量不應(yīng)該被視為數(shù)學(xué)上表征距離的函數(shù),我們應(yīng)該以偏向工程學(xué)的思維,將其視為一種量化比較的手段。
Kappa是本書作者自己設(shè)計(jì)的統(tǒng)計(jì)量(發(fā)表于論文中[235]),取值范圍為[0,1],代表隨機(jī)變量的漸進(jìn)行為。對高斯分布來說,取值為0(基準(zhǔn)值),而對柯西分布或其他均值不存在的分布取值為1。
假設(shè)X1,X2…Xn是均值有限的獨(dú)立同分布隨機(jī)變量,也即。定義
為部分序列和。那么可以定義
為n個隨機(jī)變量求和的平均絕對偏差(參照之前我們不使用中位數(shù),而是以均值為中心)。接著定義n個額外變量和收斂的“速率”(從n0開始):

在最為基礎(chǔ)的n=n0+1時(shí),我們簡單地用來表示。
2.2.6 橢圓分布
p×1維的隨機(jī)變量X為橢圓分布(橢圓等高分布)的定義是:假設(shè)位置參數(shù)為μ,存在非負(fù)矩陣Σ和標(biāo)量函數(shù)Ψ使得特征函數(shù)滿足exp(it′μ)Ψ(tΣt′)的形式。
換句話說,對于聯(lián)合分布,我們必須有奇協(xié)方差矩陣才能滿足其橢圓特性。狀態(tài)轉(zhuǎn)換協(xié)方差和隨機(jī)協(xié)方差這樣的條件都會使聯(lián)合分布遠(yuǎn)離橢圓分布。我們會在第六章給出,只要違反橢圓特性,薄尾變量的線性組合就可以展現(xiàn)出極度肥尾的性質(zhì),除了肥尾性質(zhì)本身,這一條又額外證偽了很多現(xiàn)代金融學(xué)理論。
2.2.7 統(tǒng)計(jì)獨(dú)立性
假設(shè)兩個獨(dú)立的隨機(jī)變量X和Y,如果其各自的概率密度函數(shù)(PDF)為f(x)和f(y),無論相關(guān)系數(shù)如何,聯(lián)合PDF f(x,y)都滿足:

在橢圓分布類中,相關(guān)系數(shù)為0的雙變量高斯分布既獨(dú)立又不相關(guān)。但是對多變量學(xué)生T分布或柯西分布來說,上述條件就不成立了。
2.2.8 多變量(列維)穩(wěn)定分布
這是中心極限定理的廣義版本。
假設(shè)X1,X2…Xn是獨(dú)立同分布隨機(jī)變量,它們的和為Sn,那么我們有:

這里的Xs服從穩(wěn)定分布S,an和bn是常量,代表收斂到分布(當(dāng)n→∞時(shí)X的分布)。下一章我們會對S的性質(zhì)進(jìn)行更完備的定義。這里可以認(rèn)為Xs服從穩(wěn)定分布(或者α穩(wěn)定分布),寫作XsS(αs,β,μ,σ),特征函數(shù)
的形式如下:

分布參數(shù)的限制條件為
2.2.9 多變量穩(wěn)定分布
隨機(jī)向量滿足多變量穩(wěn)定分布的條件是,所有成分的線性組合
服從穩(wěn)定分布。也即對于任意常向量
,隨機(jī)變量Y=aTX應(yīng)該是一個單變量穩(wěn)定分布。
2.2.10 卡拉瑪塔點(diǎn)
見冪律類分布。
2.2.11 亞指數(shù)
平均斯坦和極端斯坦的自然邊界為亞指數(shù)類分布,有如下性質(zhì):
假設(shè)是實(shí)數(shù)域
上的獨(dú)立同分布隨機(jī)變量,累積分布函數(shù)為F,亞指數(shù)類的分布可以定義為(見[248][196]):

這里的的累積分布函數(shù)(兩個相同的獨(dú)立隨機(jī)變量X的和),上面的定義代表了X1+X2超過x的兩倍的概率是任意單個X超過x的概率的兩倍。因此,對足夠大的x來說,每當(dāng)和超過x的時(shí)候,往往是其中某個X超過了x——兩者中的較大值,另外一個X的貢獻(xiàn)則微乎其微。
更一般地看,可以證明n個變量的和會由這些變量中的最大值主導(dǎo)。從嚴(yán)謹(jǐn)?shù)慕嵌戎v,下面兩條性質(zhì)等價(jià)于亞指數(shù)條件[43][84]。對于假設(shè)

因此,求和項(xiàng)Sn和樣本中的最大值Mn有相同的量級,這也是尾部起主導(dǎo)作用的另一種表達(dá)。
直觀來看,亞指數(shù)分布的尾部應(yīng)該比指數(shù)分布下降更慢,因?yàn)橹笖?shù)分布的尾部并非由超大尾部事件主導(dǎo)。實(shí)際上,我們可以證明,亞指數(shù)分布不存在指數(shù)矩:

所有。然而,反過來不一定成立,如果一個分布的指數(shù)矩不存在,那么它不一定滿足亞指數(shù)分布的條件。
2.2.12 近似替代:學(xué)生T分布
我們可以方便地使用自由度為α的學(xué)生T分布近似作為雙尾冪律分布,α=1對應(yīng)柯西分布,而α→∞對應(yīng)高斯分布。
學(xué)生T分布屬于主流的鐘形冪律分布,也即PDF平滑連續(xù),對于極大的正值/負(fù)值x概率趨于0,且具備單一的尖峰最大值(另外,PDF是準(zhǔn)凹結(jié)構(gòu)而不是簡單的凹結(jié)構(gòu))。
2.2.13 引用環(huán)
這是學(xué)術(shù)界的一種高度循環(huán)的引用機(jī)制,這種機(jī)制認(rèn)為,杰出論文的標(biāo)準(zhǔn)在于他人的引用,從而忽略來自外部的過濾條件。這樣會導(dǎo)致學(xué)術(shù)研究方向過于集中,很容易卡在某個“角落”,聚焦于沒有實(shí)際意義的領(lǐng)域。該機(jī)制與缺乏成熟監(jiān)督,且缺乏“風(fēng)險(xiǎn)共擔(dān)”的學(xué)術(shù)體系運(yùn)行模式有關(guān)。
典型的此類領(lǐng)域有現(xiàn)代金融理論、計(jì)量經(jīng)濟(jì)學(xué)(特別是宏觀變量計(jì)量學(xué))、GARCH過程、心理計(jì)量學(xué)、隨機(jī)控制金融學(xué)、行為經(jīng)濟(jì)和金融學(xué)、不確定性決策學(xué)、宏觀經(jīng)濟(jì)學(xué)等。這里的很多學(xué)術(shù)成果根本無法應(yīng)用于現(xiàn)實(shí),唯一的作用是貢獻(xiàn)額外的論文,并通過引用機(jī)制產(chǎn)生更多論文,如此循環(huán)下去。
2.2.14 學(xué)術(shù)尋租
科研人員在研究方向的選擇上存在利益沖突,學(xué)術(shù)部門(和研究者個人)的目標(biāo)變成了盡可能獲得引用和榮譽(yù),從而犧牲了研究方向的客觀性。比如,很多人卡在某個科研“角落”中,僅僅因?yàn)檫@對他們的職業(yè)生涯和學(xué)術(shù)組織更有利。
2.2.15 偽經(jīng)驗(yàn)主義或Pinker問題
很多人都在討論統(tǒng)計(jì)學(xué)意義并不顯著的“證據(jù)”,或者使用對隨機(jī)變量完全不適用且毫無信息量的統(tǒng)計(jì)指標(biāo),比如推斷肥尾變量的均值或者相關(guān)性。這一點(diǎn)源于:
(i)統(tǒng)計(jì)學(xué)教學(xué)上對高斯分布和其他薄尾變量的強(qiáng)調(diào)。
(ii)死記硬背統(tǒng)計(jì)術(shù)語的時(shí)候缺乏對統(tǒng)計(jì)知識的理解。
(iii)對于維度性質(zhì)毫無概念。
上述幾條在社會科學(xué)研究者中很常見。
偽經(jīng)驗(yàn)主義的例子有:比較恐怖襲擊或埃博拉病毒等流行病的致死率(肥尾)和從梯子上跌落的死亡率(薄尾)。
這種看似實(shí)證的“實(shí)證主義”是現(xiàn)代科學(xué)研究中的一種頑疾,在多維和肥尾條件下完全失效。
實(shí)際上,我們并不需要區(qū)分肥尾和高斯隨機(jī)變量就可以看出這種行為的不嚴(yán)謹(jǐn)性:沒有達(dá)到簡單的統(tǒng)計(jì)顯著性標(biāo)準(zhǔn)——這些操作者也不理解顯著性這個概念。
2.2.16 前漸進(jìn)性
數(shù)學(xué)上的統(tǒng)計(jì)研究一般聚焦于當(dāng)n=1(n為求和的數(shù)目)和n=∞的情況。而真實(shí)世界正是處于中間的那部分——這也是本書的核心。部分分布(方差有限)對于n=∞的漸進(jìn)極限是高斯分布,但是對于n很大又不為無窮的情況并不成立。
2.2.17 隨機(jī)化
將確定性變量隨機(jī)化的方式有兩種:(i)較為簡單的二元方法;(ii)通過更復(fù)雜的連續(xù)或離散分布實(shí)現(xiàn)。
(i)假設(shè)s為確定性變量,我們以雙狀態(tài)伯努利分布來進(jìn)行隨機(jī)化(入門級別),假定以概率p取s1,概率1-p取s2。該變換以ps1+(1-p)s2=s的形式保留了變量的均值s,當(dāng)然,我們也可以通過相同的方式保留變量的方差,等等。
(ii)我們可以使用一個完整的統(tǒng)計(jì)分布,雙尾條件下一般是高斯分布,單尾條件下一般是對數(shù)正態(tài)分布或指數(shù)分布(很少會用冪律分布)。當(dāng)s為標(biāo)準(zhǔn)差的時(shí)候,我們可以隨機(jī)化s2,它變成了“隨機(jī)波動率”,該波動率的方差或標(biāo)準(zhǔn)差一般被稱為“Vvol”。
2.2.18 在險(xiǎn)價(jià)值(VaR),條件在險(xiǎn)價(jià)值(CVaR)
對于某隨機(jī)變量x,分布函數(shù)為F,某參數(shù)λ,VaR的數(shù)學(xué)表達(dá)為:

然后,相應(yīng)λ下的CVaR或預(yù)期損失ES為:

或者反過來在正的定義域上,考慮X的正向尾部。
一般來說,參數(shù)k的預(yù)期損失為
2.2.19 風(fēng)險(xiǎn)共擔(dān)
風(fēng)險(xiǎn)共擔(dān)是一種過濾機(jī)制,強(qiáng)迫做菜的廚師品嘗自己做的食物,讓他們暴露在自身問題的風(fēng)險(xiǎn)之中,這樣一來就可以將危險(xiǎn)分子驅(qū)逐出去。能夠“風(fēng)險(xiǎn)共擔(dān)”的領(lǐng)域包括:管道維修、牙齒診療、外科診療、工程建造,這些領(lǐng)域的從業(yè)者以有形的工作成果被外界評估,在職業(yè)生涯斷送或破產(chǎn)的風(fēng)險(xiǎn)下從事職業(yè)活動。無法“風(fēng)險(xiǎn)共擔(dān)”的領(lǐng)域包括:互相引用的學(xué)術(shù)界。學(xué)術(shù)領(lǐng)域的從業(yè)者只依賴同儕的相互評估而非從真實(shí)世界中獲得反饋。
2.2.20 MS圖
MS圖(maximum to sum)表示最大單一觀測對某階矩的貢獻(xiàn)(隨著n不斷變大),我們可以觀察到大數(shù)定律的行為。對隨機(jī)變量X來說,在MS圖上觀察給定樣本的高階矩表現(xiàn)是一種判定的收斂性的簡易方法[或者看看
是否存在]。其中一種做法如圖10.3所示。
根據(jù)對變量極大值的統(tǒng)計(jì),MS圖的原理正是大數(shù)定律[184]。對于獨(dú)立同分布的非負(fù)X1,X2…Xn,假設(shè)對于,那么隨著

這里為求和函數(shù),然后
為極大值函數(shù)(對于存在負(fù)值的隨機(jī)變量X,我們也可以采用取絕對值的形式來求奇數(shù)階矩)。
2.2.21 最大吸引域(MDA)
極值分布考慮的是隨機(jī)變量的最大值,當(dāng)(分布的“右端點(diǎn)”)在最大吸引域上[116],也可以表示為:

2.2.22 心理學(xué)文獻(xiàn)中的積分替換
心理學(xué)文獻(xiàn)中經(jīng)常有如下混淆:假設(shè)為某一閾值,f(.)是概率密度函數(shù),并且
是超過K的概率,g(x)是影響函數(shù)。定義I1是超過K之上的期望收益:

而I2是K處的影響乘以超過K的概率:

這里很容易混淆的是I1和I2,g(.)在K以上是常數(shù)的時(shí)候[比如,階躍θ函數(shù)]兩者相等。對一階導(dǎo)為正的g(.)來說,I1和I2只有在薄尾分布下才比較接近,在肥尾條件下會相去甚遠(yuǎn)。
2.2.23 概率的不可分拆性(另一個常見誤區(qū))
定義是導(dǎo)數(shù)為f的概率分布,以及
是測量函數(shù)或“收益函數(shù)”,那么對于
的子集

在離散分布下,假設(shè)概率質(zhì)量函數(shù)π(.):

這里的思想在于,概率只是積分等式中的核,而不是決策之外的最終結(jié)果。
2.2.24 維特根斯坦的尺子
“維特根斯坦的尺子”是一個哲學(xué)比喻:我們是在用尺子量桌子還是在用桌子量尺子?這主要取決于結(jié)果。假設(shè)存在兩種分布:高斯分布和冪律分布,我們認(rèn)為,當(dāng)出現(xiàn)一個超大偏差的時(shí)候,比如“6個標(biāo)準(zhǔn)差”事件意味著原分布屬于冪律分布。
2.2.25 黑天鵝

總的來說,有些事件在你的預(yù)期和建模能力之外,而且其效應(yīng)極為顯著。好的方法不是去預(yù)測它們,而是對它們產(chǎn)生的影響呈現(xiàn)出凸性(至少不是凹性):我們能了解自身對某類事件的脆弱性,甚至可以對其量化衡量(考量二階影響和結(jié)果的非對稱性),但是想對它們做可信的統(tǒng)計(jì)處理基本上是癡心妄想。
這一點(diǎn)向來很難跟建模人員解釋清楚,我們需要和從未見過(甚至從未想過)的事物共處,但事實(shí)就是這樣。
注意認(rèn)知的維度。黑天鵝和觀察者相關(guān):火雞的黑天鵝對屠夫來說是白天鵝。9·11恐怖襲擊事件對受害者來說是黑天鵝,但對恐怖分子不是。這種觀察者依賴是一種中心化的性質(zhì)。一個所謂的“客觀”的黑天鵝概率模型不僅不存在,而且是對其自身意義的消解,因?yàn)樗陨砭驮谏⒉バ畔⒌牟煌陚湫浴?/p>
灰天鵝:統(tǒng)計(jì)性質(zhì)上穩(wěn)定、低頻且有重大影響的大偏差被稱為“灰天鵝”。當(dāng)然,“灰”的程度取決于觀察者:冪律分布使用者的灰天鵝對困在薄尾框架體系下的天真的統(tǒng)計(jì)學(xué)家來說就是黑天鵝。
重申一下:黑天鵝不是肥尾,只是肥尾會讓它們變得更糟糕。肥尾和黑天鵝的聯(lián)系在于,肥尾區(qū)域的大偏差會放大黑天鵝的影響。
2.2.26 經(jīng)驗(yàn)分布會超出經(jīng)驗(yàn)
經(jīng)驗(yàn)分布的生存函數(shù)定義如下,假設(shè)X1,X2…Xn為獨(dú)立同分布實(shí)隨機(jī)變量,具有共同的累積分布函數(shù)F(t)。

這里是指示函數(shù)。
由格利文科-坎泰利定理可知,無論初始分布如何,最大范數(shù)都會收斂到單一分布,可以通過科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)來驗(yàn)證:

這種和分布無關(guān)的收斂性主要考慮的是概率,而不是矩——本書作者由此出發(fā),探究了最大值之上的“隱藏矩”。
我們可以看到如下結(jié)果(因?yàn)橹罉O值為0和1,頓斯科將其進(jìn)一步轉(zhuǎn)化為布朗橋):

“經(jīng)驗(yàn)分布會超出經(jīng)驗(yàn)”的意思是,經(jīng)驗(yàn)分布一定會出現(xiàn)在某區(qū)間[xmin,xmax],此時(shí)肥尾分布會帶來巨大的問題,因?yàn)槲覀儾皇窃诟怕士臻g,而是在收益空間分析肥尾。
更進(jìn)一步的內(nèi)容見隱藏的尾部(下一小節(jié))。
2.2.27 隱藏的尾部
假設(shè)Kn為n個獨(dú)立同分布隨機(jī)變量樣本的最大值,Kn=max(X1,X2…Xn),假設(shè)X分布的密度函數(shù)為,我們可以將矩分解為兩部分,在K0以上的部分為“隱藏矩”。

這里μL是分布中可觀察的部分的矩,而μK是隱藏部分的矩(大于K)。格利文科-坎泰利定理告訴我們,μK,0應(yīng)該和X的分布無關(guān)。但是這一條對高階矩并不成立,所以科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)在這里存在問題。
2.2.28 影子矩
影子矩在本書中被稱為通過“插入式”估計(jì)來求解的矩。它不是直接用可觀察的樣本求均值,而是通過對分布參數(shù)進(jìn)行最大似然估計(jì)(如使用最大似然參數(shù)尾部指數(shù)α)得出影子均值。因?yàn)樵诜饰矖l件下直接可觀察的樣本均值存在偏差。
2.2.29 尾部依賴
假設(shè)X1和X2是兩個不一定為同分布類型的隨機(jī)變量,假設(shè)是概率為q的逆CDF,也即
,上尾依賴
可以定義為:

下尾依賴的定義與此類似。
2.2.30 元概率
通過將變量隨機(jī)化這樣的技巧來比較兩個不同的概率分布。或是隨機(jī)化某個參數(shù)以得到對應(yīng)的分布,如看漲期權(quán)價(jià)格,VaR、CVaR等風(fēng)險(xiǎn)指標(biāo),并檢驗(yàn)結(jié)果分布的魯棒性或凸性。
2.2.31 動態(tài)對沖
標(biāo)的為S,到期時(shí)間為T的歐式看漲期權(quán)C的收益可以通過如下動態(tài)對沖的方法得到復(fù)制,在當(dāng)前時(shí)間t和T之間:

我們將時(shí)間區(qū)間分成n個,這里的對沖比率
是在
時(shí)刻計(jì)算的,但是我們在股票上得到的是對沖時(shí)刻和
之間的價(jià)格差。
理論上,的時(shí)候會使上式收斂到確定性收益。在高斯世界中,上式為伊藤-麥肯積分。
但在這里我們看到,在肥尾條件所伴隨的漸進(jìn)性質(zhì)下,這樣的動態(tài)復(fù)制完全不可能實(shí)現(xiàn)。
- 一本書輕松讀懂銷售心理學(xué)(200個實(shí)用案例圖解版)
- 重慶市萬村千鄉(xiāng)市場工程的調(diào)研報(bào)告
- 上市公司現(xiàn)金分紅、股價(jià)信息含量和企業(yè)投資效率作用機(jī)制研究
- 關(guān)于未來的答案系列套裝(全10冊)
- 要素市場扭曲對產(chǎn)業(yè)技術(shù)創(chuàng)新的影響及其機(jī)制
- 你是那99%,還是那1%?像經(jīng)濟(jì)學(xué)家一樣思考
- 贏在企業(yè)文化:企業(yè)文化建設(shè)路徑方法與操作實(shí)務(wù)
- 經(jīng)濟(jì)學(xué)智慧之光
- 戰(zhàn)略與路徑:黃奇帆的十二堂經(jīng)濟(jì)課
- 反套路經(jīng)濟(jì)學(xué):為什么常識會撒謊?
- 元宇宙帶來什么:商業(yè)前景與我們的未來世界
- 在哈佛看美國:一位經(jīng)濟(jì)學(xué)家的觀察與思考
- 絲路駝鈴:絲綢之路經(jīng)濟(jì)帶
- 創(chuàng)客平臺革命:創(chuàng)客空間與技術(shù)工坊如何孵化未來科技
- 未來經(jīng)濟(jì)學(xué):5G+人工智能趨勢洞察