火树赢花爆分图片

書名：肥尾效應(yīng)
作者名： (美)納西姆·尼古拉斯·塔勒布
本章字?jǐn)?shù)： 5446字
更新時(shí)間： 2022-09-02 10:35:00

2.2　一般＆特殊概念目錄

下面是一些核心要點(diǎn)的定義（可能和后面存在重復(fù)）。

2.2.1　冪律類分布

冪律類分布一般通過如下生存函數(shù)的性質(zhì)來定義。假設(shè)隨機(jī)變量X屬于右尾為“冪律”的分布類，也就是：

這里是緩變函數(shù)，對于所有k＞0，定義如下[22]：

變量X的生存函數(shù)屬于“正規(guī)變化”類RVα，具體來說，函數(shù)在無窮大處以指數(shù)ρ變化：

更進(jìn)一步看，會存在一個點(diǎn)，使得L(x)趨向于極限的時(shí)候?yàn)槌?shù)l，我們稱它為“卡拉瑪塔常數(shù)”（Karamata），該點(diǎn)也被稱為“卡拉瑪塔點(diǎn)”。在該值之外，冪律尾可以通過希爾估計(jì)這樣的標(biāo)準(zhǔn)方法來擬合。該區(qū)域內(nèi)的分布也被曼德博[162][75]稱為強(qiáng)帕累托法則。

對于分布左尾，上述規(guī)律類似。

2.2.2　大數(shù)定律（弱）

大數(shù)定律的標(biāo)準(zhǔn)形式如下，假設(shè)X1,X2…Xn是獨(dú)立同分布（i.i.d.）的無限序列（勒貝格可積），且（盡管有時(shí)可以放松獨(dú)立同分布條件）。樣本均值會收斂到期望值，對于

這里方差有限并非必要條件（不過各高階矩的存在會加快收斂速度）。

強(qiáng)大數(shù)定律有需要時(shí)再做討論。

2.2.3　中心極限定理（CLT）

中心極限定理的標(biāo)準(zhǔn)形式（Lindeberg-Lévy）如下，假設(shè)有一系列獨(dú)立同分布的隨機(jī)變量，是n個樣本的均值，當(dāng)n趨于無窮時(shí)，隨機(jī)變量的和會收斂到高斯分布[20][21]。

這里收斂到分布的意思是，對于每一個實(shí)數(shù)z，的CDF（累積分布函數(shù)）會點(diǎn)對點(diǎn)收斂到標(biāo)準(zhǔn)高斯分布的CDF，N(0,σ)：

Φ(z)是z處標(biāo)準(zhǔn)高斯分布的CDF值。

中心極限定理還有很多其他版本，下面有需要時(shí)會展開論述。

2.2.4　中數(shù)定律和漸進(jìn)論

這是全書的主旨，我們想要了解隨機(jī)變量數(shù)目n比較大但又不是極大時(shí)的漸進(jìn)行為。對高斯分布來說，這不是什么大問題，因?yàn)槭諗克俣群芸欤ù髷?shù)定律和中心極限定理都是），但是對很多其他的隨機(jī)變量來說并非如此。

見下面的Kappa統(tǒng)計(jì)量。

2.2.5　Kappa統(tǒng)計(jì)量

這一統(tǒng)計(jì)量不應(yīng)該被視為數(shù)學(xué)上表征距離的函數(shù)，我們應(yīng)該以偏向工程學(xué)的思維，將其視為一種量化比較的手段。

Kappa是本書作者自己設(shè)計(jì)的統(tǒng)計(jì)量（發(fā)表于論文中[235]），取值范圍為[0，1]，代表隨機(jī)變量的漸進(jìn)行為。對高斯分布來說，取值為0（基準(zhǔn)值），而對柯西分布或其他均值不存在的分布取值為1。

假設(shè)X1,X2…Xn是均值有限的獨(dú)立同分布隨機(jī)變量，也即。定義為部分序列和。那么可以定義為n個隨機(jī)變量求和的平均絕對偏差（參照之前我們不使用中位數(shù)，而是以均值為中心）。接著定義n個額外變量和收斂的“速率”（從n0開始）：

在最為基礎(chǔ)的n=n0+1時(shí)，我們簡單地用來表示。

2.2.6　橢圓分布

p×1維的隨機(jī)變量X為橢圓分布（橢圓等高分布）的定義是：假設(shè)位置參數(shù)為μ，存在非負(fù)矩陣Σ和標(biāo)量函數(shù)Ψ使得特征函數(shù)滿足exp(it′μ)Ψ(tΣt′)的形式。

換句話說，對于聯(lián)合分布，我們必須有奇協(xié)方差矩陣才能滿足其橢圓特性。狀態(tài)轉(zhuǎn)換協(xié)方差和隨機(jī)協(xié)方差這樣的條件都會使聯(lián)合分布遠(yuǎn)離橢圓分布。我們會在第六章給出，只要違反橢圓特性，薄尾變量的線性組合就可以展現(xiàn)出極度肥尾的性質(zhì)，除了肥尾性質(zhì)本身，這一條又額外證偽了很多現(xiàn)代金融學(xué)理論。

2.2.7　統(tǒng)計(jì)獨(dú)立性

假設(shè)兩個獨(dú)立的隨機(jī)變量X和Y，如果其各自的概率密度函數(shù)（PDF）為f(x)和f(y)，無論相關(guān)系數(shù)如何，聯(lián)合PDF f(x,y)都滿足：

在橢圓分布類中，相關(guān)系數(shù)為0的雙變量高斯分布既獨(dú)立又不相關(guān)。但是對多變量學(xué)生T分布或柯西分布來說，上述條件就不成立了。

2.2.8　多變量（列維）穩(wěn)定分布

這是中心極限定理的廣義版本。

假設(shè)X1,X2…Xn是獨(dú)立同分布隨機(jī)變量，它們的和為Sn，那么我們有：

這里的Xs服從穩(wěn)定分布S，an和bn是常量，代表收斂到分布（當(dāng)n→∞時(shí)X的分布）。下一章我們會對S的性質(zhì)進(jìn)行更完備的定義。這里可以認(rèn)為Xs服從穩(wěn)定分布（或者α穩(wěn)定分布），寫作XsS(αs，β，μ，σ)，特征函數(shù)的形式如下：

分布參數(shù)的限制條件為

2.2.9　多變量穩(wěn)定分布

隨機(jī)向量滿足多變量穩(wěn)定分布的條件是，所有成分的線性組合服從穩(wěn)定分布。也即對于任意常向量，隨機(jī)變量Y=aTX應(yīng)該是一個單變量穩(wěn)定分布。

2.2.10　卡拉瑪塔點(diǎn)

見冪律類分布。

2.2.11　亞指數(shù)

平均斯坦和極端斯坦的自然邊界為亞指數(shù)類分布，有如下性質(zhì)：

假設(shè)是實(shí)數(shù)域上的獨(dú)立同分布隨機(jī)變量，累積分布函數(shù)為F，亞指數(shù)類的分布可以定義為（見[248][196]）：

這里的的累積分布函數(shù)（兩個相同的獨(dú)立隨機(jī)變量X的和），上面的定義代表了X1+X2超過x的兩倍的概率是任意單個X超過x的概率的兩倍。因此，對足夠大的x來說，每當(dāng)和超過x的時(shí)候，往往是其中某個X超過了x——兩者中的較大值，另外一個X的貢獻(xiàn)則微乎其微。

更一般地看，可以證明n個變量的和會由這些變量中的最大值主導(dǎo)。從嚴(yán)謹(jǐn)?shù)慕嵌戎v，下面兩條性質(zhì)等價(jià)于亞指數(shù)條件[43][84]。對于假設(shè)

因此，求和項(xiàng)Sn和樣本中的最大值Mn有相同的量級，這也是尾部起主導(dǎo)作用的另一種表達(dá)。

直觀來看，亞指數(shù)分布的尾部應(yīng)該比指數(shù)分布下降更慢，因?yàn)橹笖?shù)分布的尾部并非由超大尾部事件主導(dǎo)。實(shí)際上，我們可以證明，亞指數(shù)分布不存在指數(shù)矩：

所有。然而，反過來不一定成立，如果一個分布的指數(shù)矩不存在，那么它不一定滿足亞指數(shù)分布的條件。

2.2.12　近似替代：學(xué)生T分布

我們可以方便地使用自由度為α的學(xué)生T分布近似作為雙尾冪律分布，α=1對應(yīng)柯西分布，而α→∞對應(yīng)高斯分布。

學(xué)生T分布屬于主流的鐘形冪律分布，也即PDF平滑連續(xù)，對于極大的正值/負(fù)值x概率趨于0，且具備單一的尖峰最大值（另外，PDF是準(zhǔn)凹結(jié)構(gòu)而不是簡單的凹結(jié)構(gòu)）。

2.2.13　引用環(huán)

這是學(xué)術(shù)界的一種高度循環(huán)的引用機(jī)制，這種機(jī)制認(rèn)為，杰出論文的標(biāo)準(zhǔn)在于他人的引用，從而忽略來自外部的過濾條件。這樣會導(dǎo)致學(xué)術(shù)研究方向過于集中，很容易卡在某個“角落”，聚焦于沒有實(shí)際意義的領(lǐng)域。該機(jī)制與缺乏成熟監(jiān)督，且缺乏“風(fēng)險(xiǎn)共擔(dān)”的學(xué)術(shù)體系運(yùn)行模式有關(guān)。

典型的此類領(lǐng)域有現(xiàn)代金融理論、計(jì)量經(jīng)濟(jì)學(xué)（特別是宏觀變量計(jì)量學(xué)）、GARCH過程、心理計(jì)量學(xué)、隨機(jī)控制金融學(xué)、行為經(jīng)濟(jì)和金融學(xué)、不確定性決策學(xué)、宏觀經(jīng)濟(jì)學(xué)等。這里的很多學(xué)術(shù)成果根本無法應(yīng)用于現(xiàn)實(shí)，唯一的作用是貢獻(xiàn)額外的論文，并通過引用機(jī)制產(chǎn)生更多論文，如此循環(huán)下去。

2.2.14　學(xué)術(shù)尋租

科研人員在研究方向的選擇上存在利益沖突，學(xué)術(shù)部門（和研究者個人）的目標(biāo)變成了盡可能獲得引用和榮譽(yù)，從而犧牲了研究方向的客觀性。比如，很多人卡在某個科研“角落”中，僅僅因?yàn)檫@對他們的職業(yè)生涯和學(xué)術(shù)組織更有利。

2.2.15　偽經(jīng)驗(yàn)主義或Pinker問題

很多人都在討論統(tǒng)計(jì)學(xué)意義并不顯著的“證據(jù)”，或者使用對隨機(jī)變量完全不適用且毫無信息量的統(tǒng)計(jì)指標(biāo)，比如推斷肥尾變量的均值或者相關(guān)性。這一點(diǎn)源于：

（i）統(tǒng)計(jì)學(xué)教學(xué)上對高斯分布和其他薄尾變量的強(qiáng)調(diào)。

（ii）死記硬背統(tǒng)計(jì)術(shù)語的時(shí)候缺乏對統(tǒng)計(jì)知識的理解。

（iii）對于維度性質(zhì)毫無概念。

上述幾條在社會科學(xué)研究者中很常見。

偽經(jīng)驗(yàn)主義的例子有：比較恐怖襲擊或埃博拉病毒等流行病的致死率（肥尾）和從梯子上跌落的死亡率（薄尾）。

這種看似實(shí)證的“實(shí)證主義”是現(xiàn)代科學(xué)研究中的一種頑疾，在多維和肥尾條件下完全失效。

實(shí)際上，我們并不需要區(qū)分肥尾和高斯隨機(jī)變量就可以看出這種行為的不嚴(yán)謹(jǐn)性：沒有達(dá)到簡單的統(tǒng)計(jì)顯著性標(biāo)準(zhǔn)——這些操作者也不理解顯著性這個概念。

2.2.16　前漸進(jìn)性

數(shù)學(xué)上的統(tǒng)計(jì)研究一般聚焦于當(dāng)n=1（n為求和的數(shù)目）和n=∞的情況。而真實(shí)世界正是處于中間的那部分——這也是本書的核心。部分分布（方差有限）對于n=∞的漸進(jìn)極限是高斯分布，但是對于n很大又不為無窮的情況并不成立。

2.2.17　隨機(jī)化

將確定性變量隨機(jī)化的方式有兩種：（i）較為簡單的二元方法；（ii）通過更復(fù)雜的連續(xù)或離散分布實(shí)現(xiàn)。

（i）假設(shè)s為確定性變量，我們以雙狀態(tài)伯努利分布來進(jìn)行隨機(jī)化（入門級別），假定以概率p取s1，概率1-p取s2。該變換以ps1+(1-p)s2=s的形式保留了變量的均值s，當(dāng)然，我們也可以通過相同的方式保留變量的方差，等等。

（ii）我們可以使用一個完整的統(tǒng)計(jì)分布，雙尾條件下一般是高斯分布，單尾條件下一般是對數(shù)正態(tài)分布或指數(shù)分布（很少會用冪律分布）。當(dāng)s為標(biāo)準(zhǔn)差的時(shí)候，我們可以隨機(jī)化s2，它變成了“隨機(jī)波動率”，該波動率的方差或標(biāo)準(zhǔn)差一般被稱為“Vvol”。

2.2.18　在險(xiǎn)價(jià)值（VaR），條件在險(xiǎn)價(jià)值（CVaR）

對于某隨機(jī)變量x，分布函數(shù)為F，某參數(shù)λ，VaR的數(shù)學(xué)表達(dá)為：

然后，相應(yīng)λ下的CVaR或預(yù)期損失ES為：

或者反過來在正的定義域上，考慮X的正向尾部。

一般來說，參數(shù)k的預(yù)期損失為

2.2.19　風(fēng)險(xiǎn)共擔(dān)

風(fēng)險(xiǎn)共擔(dān)是一種過濾機(jī)制，強(qiáng)迫做菜的廚師品嘗自己做的食物，讓他們暴露在自身問題的風(fēng)險(xiǎn)之中，這樣一來就可以將危險(xiǎn)分子驅(qū)逐出去。能夠“風(fēng)險(xiǎn)共擔(dān)”的領(lǐng)域包括：管道維修、牙齒診療、外科診療、工程建造，這些領(lǐng)域的從業(yè)者以有形的工作成果被外界評估，在職業(yè)生涯斷送或破產(chǎn)的風(fēng)險(xiǎn)下從事職業(yè)活動。無法“風(fēng)險(xiǎn)共擔(dān)”的領(lǐng)域包括：互相引用的學(xué)術(shù)界。學(xué)術(shù)領(lǐng)域的從業(yè)者只依賴同儕的相互評估而非從真實(shí)世界中獲得反饋。

2.2.20　MS圖

MS圖（maximum to sum）表示最大單一觀測對某階矩的貢獻(xiàn)（隨著n不斷變大），我們可以觀察到大數(shù)定律的行為。對隨機(jī)變量X來說，在MS圖上觀察給定樣本的高階矩表現(xiàn)是一種判定的收斂性的簡易方法[或者看看是否存在]。其中一種做法如圖10.3所示。

根據(jù)對變量極大值的統(tǒng)計(jì)，MS圖的原理正是大數(shù)定律[184]。對于獨(dú)立同分布的非負(fù)X1,X2…Xn，假設(shè)對于，那么隨著

這里為求和函數(shù)，然后為極大值函數(shù)（對于存在負(fù)值的隨機(jī)變量X，我們也可以采用取絕對值的形式來求奇數(shù)階矩）。

2.2.21　最大吸引域（MDA）

極值分布考慮的是隨機(jī)變量的最大值，當(dāng)（分布的“右端點(diǎn)”）在最大吸引域上[116]，也可以表示為：

2.2.22　心理學(xué)文獻(xiàn)中的積分替換

心理學(xué)文獻(xiàn)中經(jīng)常有如下混淆：假設(shè)為某一閾值，f(.)是概率密度函數(shù)，并且是超過K的概率，g(x)是影響函數(shù)。定義I1是超過K之上的期望收益：

而I2是K處的影響乘以超過K的概率：

這里很容易混淆的是I1和I2，g(.)在K以上是常數(shù)的時(shí)候[比如，階躍θ函數(shù)]兩者相等。對一階導(dǎo)為正的g(.)來說，I1和I2只有在薄尾分布下才比較接近，在肥尾條件下會相去甚遠(yuǎn)。

2.2.23　概率的不可分拆性（另一個常見誤區(qū)）

定義是導(dǎo)數(shù)為f的概率分布，以及是測量函數(shù)或“收益函數(shù)”，那么對于的子集

在離散分布下，假設(shè)概率質(zhì)量函數(shù)π(.)：

這里的思想在于，概率只是積分等式中的核，而不是決策之外的最終結(jié)果。

2.2.24　維特根斯坦的尺子

“維特根斯坦的尺子”是一個哲學(xué)比喻：我們是在用尺子量桌子還是在用桌子量尺子？這主要取決于結(jié)果。假設(shè)存在兩種分布：高斯分布和冪律分布，我們認(rèn)為，當(dāng)出現(xiàn)一個超大偏差的時(shí)候，比如“6個標(biāo)準(zhǔn)差”事件意味著原分布屬于冪律分布。

2.2.25　黑天鵝

總的來說，有些事件在你的預(yù)期和建模能力之外，而且其效應(yīng)極為顯著。好的方法不是去預(yù)測它們，而是對它們產(chǎn)生的影響呈現(xiàn)出凸性（至少不是凹性）：我們能了解自身對某類事件的脆弱性，甚至可以對其量化衡量（考量二階影響和結(jié)果的非對稱性），但是想對它們做可信的統(tǒng)計(jì)處理基本上是癡心妄想。

這一點(diǎn)向來很難跟建模人員解釋清楚，我們需要和從未見過（甚至從未想過）的事物共處，但事實(shí)就是這樣。正如保羅·波爾泰西常說的（這里可能是正確或是誤用了他的話）那樣：“你從未見過分布的另一面。”

注意認(rèn)知的維度。黑天鵝和觀察者相關(guān)：火雞的黑天鵝對屠夫來說是白天鵝。9·11恐怖襲擊事件對受害者來說是黑天鵝，但對恐怖分子不是。這種觀察者依賴是一種中心化的性質(zhì)。一個所謂的“客觀”的黑天鵝概率模型不僅不存在，而且是對其自身意義的消解，因?yàn)樗陨砭驮谏⒉バ畔⒌牟煌陚湫浴?/p>

灰天鵝：統(tǒng)計(jì)性質(zhì)上穩(wěn)定、低頻且有重大影響的大偏差被稱為“灰天鵝”。當(dāng)然，“灰”的程度取決于觀察者：冪律分布使用者的灰天鵝對困在薄尾框架體系下的天真的統(tǒng)計(jì)學(xué)家來說就是黑天鵝。

重申一下：黑天鵝不是肥尾，只是肥尾會讓它們變得更糟糕。肥尾和黑天鵝的聯(lián)系在于，肥尾區(qū)域的大偏差會放大黑天鵝的影響。