官术网_书友最值得收藏!

2.2 一般&特殊概念目錄

下面是一些核心要點(diǎn)的定義(可能和后面存在重復(fù))。

2.2.1 冪律類分布

冪律類分布一般通過如下生存函數(shù)的性質(zhì)來定義。假設(shè)隨機(jī)變量X屬于右尾為“冪律”的分布類,也就是:

這里是緩變函數(shù),對于所有k>0,定義如下[22]:

變量X的生存函數(shù)屬于“正規(guī)變化”類RVα,具體來說,函數(shù)在無窮大處以指數(shù)ρ變化

更進(jìn)一步看,會存在一個點(diǎn),使得L(x)趨向于極限的時(shí)候?yàn)槌?shù)l,我們稱它為“卡拉瑪塔常數(shù)”(Karamata),該點(diǎn)也被稱為“卡拉瑪塔點(diǎn)”。在該值之外,冪律尾可以通過希爾估計(jì)這樣的標(biāo)準(zhǔn)方法來擬合。該區(qū)域內(nèi)的分布也被曼德博[162][75]稱為強(qiáng)帕累托法則。

對于分布左尾,上述規(guī)律類似。

2.2.2 大數(shù)定律(弱)

大數(shù)定律的標(biāo)準(zhǔn)形式如下,假設(shè)X1,X2…Xn是獨(dú)立同分布(i.i.d.)的無限序列(勒貝格可積),且(盡管有時(shí)可以放松獨(dú)立同分布條件)。樣本均值會收斂到期望值,對于

這里方差有限并非必要條件(不過各高階矩的存在會加快收斂速度)。

強(qiáng)大數(shù)定律有需要時(shí)再做討論。

2.2.3 中心極限定理(CLT)

中心極限定理的標(biāo)準(zhǔn)形式(Lindeberg-Lévy)如下,假設(shè)有一系列獨(dú)立同分布的隨機(jī)變量,是n個樣本的均值,當(dāng)n趨于無窮時(shí),隨機(jī)變量的和會收斂到高斯分布[20][21]。

這里收斂到分布的意思是,對于每一個實(shí)數(shù)z,的CDF(累積分布函數(shù))會點(diǎn)對點(diǎn)收斂到標(biāo)準(zhǔn)高斯分布的CDF,N(0,σ):

Φ(z)是z處標(biāo)準(zhǔn)高斯分布的CDF值。

中心極限定理還有很多其他版本,下面有需要時(shí)會展開論述。

2.2.4 中數(shù)定律和漸進(jìn)論

這是全書的主旨,我們想要了解隨機(jī)變量數(shù)目n比較大但又不是極大時(shí)的漸進(jìn)行為。對高斯分布來說,這不是什么大問題,因?yàn)槭諗克俣群芸欤ù髷?shù)定律和中心極限定理都是),但是對很多其他的隨機(jī)變量來說并非如此。

見下面的Kappa統(tǒng)計(jì)量。

2.2.5 Kappa統(tǒng)計(jì)量

這一統(tǒng)計(jì)量不應(yīng)該被視為數(shù)學(xué)上表征距離的函數(shù),我們應(yīng)該以偏向工程學(xué)的思維,將其視為一種量化比較的手段。

Kappa是本書作者自己設(shè)計(jì)的統(tǒng)計(jì)量(發(fā)表于論文中[235]),取值范圍為[0,1],代表隨機(jī)變量的漸進(jìn)行為。對高斯分布來說,取值為0(基準(zhǔn)值),而對柯西分布或其他均值不存在的分布取值為1。

假設(shè)X1,X2…Xn是均值有限的獨(dú)立同分布隨機(jī)變量,也即。定義為部分序列和。那么可以定義為n個隨機(jī)變量求和的平均絕對偏差(參照之前我們不使用中位數(shù),而是以均值為中心)。接著定義n個額外變量和收斂的“速率”(從n0開始):

在最為基礎(chǔ)的n=n0+1時(shí),我們簡單地用來表示。

2.2.6 橢圓分布

p×1維的隨機(jī)變量X為橢圓分布(橢圓等高分布)的定義是:假設(shè)位置參數(shù)為μ,存在非負(fù)矩陣Σ和標(biāo)量函數(shù)Ψ使得特征函數(shù)滿足exp(it′μ)Ψ(tΣt′)的形式。

換句話說,對于聯(lián)合分布,我們必須有奇協(xié)方差矩陣才能滿足其橢圓特性。狀態(tài)轉(zhuǎn)換協(xié)方差和隨機(jī)協(xié)方差這樣的條件都會使聯(lián)合分布遠(yuǎn)離橢圓分布。我們會在第六章給出,只要違反橢圓特性,薄尾變量的線性組合就可以展現(xiàn)出極度肥尾的性質(zhì),除了肥尾性質(zhì)本身,這一條又額外證偽了很多現(xiàn)代金融學(xué)理論。

2.2.7 統(tǒng)計(jì)獨(dú)立性

假設(shè)兩個獨(dú)立的隨機(jī)變量X和Y,如果其各自的概率密度函數(shù)(PDF)為f(x)和f(y),無論相關(guān)系數(shù)如何,聯(lián)合PDF f(x,y)都滿足:

在橢圓分布類中,相關(guān)系數(shù)為0的雙變量高斯分布既獨(dú)立又不相關(guān)。但是對多變量學(xué)生T分布或柯西分布來說,上述條件就不成立了。

2.2.8 多變量(列維)穩(wěn)定分布

這是中心極限定理的廣義版本。

假設(shè)X1,X2…Xn是獨(dú)立同分布隨機(jī)變量,它們的和為Sn,那么我們有:

這里的Xs服從穩(wěn)定分布S,an和bn是常量,代表收斂到分布(當(dāng)n→∞時(shí)X的分布)。下一章我們會對S的性質(zhì)進(jìn)行更完備的定義。這里可以認(rèn)為Xs服從穩(wěn)定分布(或者α穩(wěn)定分布),寫作XsS(αs,β,μ,σ),特征函數(shù)的形式如下:

分布參數(shù)的限制條件為

2.2.9 多變量穩(wěn)定分布

隨機(jī)向量滿足多變量穩(wěn)定分布的條件是,所有成分的線性組合服從穩(wěn)定分布。也即對于任意常向量,隨機(jī)變量Y=aTX應(yīng)該是一個單變量穩(wěn)定分布。

2.2.10 卡拉瑪塔點(diǎn)

見冪律類分布。

2.2.11 亞指數(shù)

平均斯坦和極端斯坦的自然邊界為亞指數(shù)類分布,有如下性質(zhì):

假設(shè)是實(shí)數(shù)域上的獨(dú)立同分布隨機(jī)變量,累積分布函數(shù)為F,亞指數(shù)類的分布可以定義為(見[248][196]):

這里的的累積分布函數(shù)(兩個相同的獨(dú)立隨機(jī)變量X的和),上面的定義代表了X1+X2超過x的兩倍的概率是任意單個X超過x的概率的兩倍。因此,對足夠大的x來說,每當(dāng)和超過x的時(shí)候,往往是其中某個X超過了x——兩者中的較大值,另外一個X的貢獻(xiàn)則微乎其微。

更一般地看,可以證明n個變量的和會由這些變量中的最大值主導(dǎo)。從嚴(yán)謹(jǐn)?shù)慕嵌戎v,下面兩條性質(zhì)等價(jià)于亞指數(shù)條件[43][84]。對于假設(shè)

因此,求和項(xiàng)Sn和樣本中的最大值Mn有相同的量級,這也是尾部起主導(dǎo)作用的另一種表達(dá)。

直觀來看,亞指數(shù)分布的尾部應(yīng)該比指數(shù)分布下降更慢,因?yàn)橹笖?shù)分布的尾部并非由超大尾部事件主導(dǎo)。實(shí)際上,我們可以證明,亞指數(shù)分布不存在指數(shù)矩:

所有。然而,反過來不一定成立,如果一個分布的指數(shù)矩不存在,那么它不一定滿足亞指數(shù)分布的條件。

2.2.12 近似替代:學(xué)生T分布

我們可以方便地使用自由度為α的學(xué)生T分布近似作為雙尾冪律分布,α=1對應(yīng)柯西分布,而α→∞對應(yīng)高斯分布。

學(xué)生T分布屬于主流的鐘形冪律分布,也即PDF平滑連續(xù),對于極大的正值/負(fù)值x概率趨于0,且具備單一的尖峰最大值(另外,PDF是準(zhǔn)凹結(jié)構(gòu)而不是簡單的凹結(jié)構(gòu))。

2.2.13 引用環(huán)

這是學(xué)術(shù)界的一種高度循環(huán)的引用機(jī)制,這種機(jī)制認(rèn)為,杰出論文的標(biāo)準(zhǔn)在于他人的引用,從而忽略來自外部的過濾條件。這樣會導(dǎo)致學(xué)術(shù)研究方向過于集中,很容易卡在某個“角落”,聚焦于沒有實(shí)際意義的領(lǐng)域。該機(jī)制與缺乏成熟監(jiān)督,且缺乏“風(fēng)險(xiǎn)共擔(dān)”的學(xué)術(shù)體系運(yùn)行模式有關(guān)。

典型的此類領(lǐng)域有現(xiàn)代金融理論、計(jì)量經(jīng)濟(jì)學(xué)(特別是宏觀變量計(jì)量學(xué))、GARCH過程、心理計(jì)量學(xué)、隨機(jī)控制金融學(xué)、行為經(jīng)濟(jì)和金融學(xué)、不確定性決策學(xué)、宏觀經(jīng)濟(jì)學(xué)等。這里的很多學(xué)術(shù)成果根本無法應(yīng)用于現(xiàn)實(shí),唯一的作用是貢獻(xiàn)額外的論文,并通過引用機(jī)制產(chǎn)生更多論文,如此循環(huán)下去。

2.2.14 學(xué)術(shù)尋租

科研人員在研究方向的選擇上存在利益沖突,學(xué)術(shù)部門(和研究者個人)的目標(biāo)變成了盡可能獲得引用和榮譽(yù),從而犧牲了研究方向的客觀性。比如,很多人卡在某個科研“角落”中,僅僅因?yàn)檫@對他們的職業(yè)生涯和學(xué)術(shù)組織更有利。

2.2.15 偽經(jīng)驗(yàn)主義或Pinker問題

很多人都在討論統(tǒng)計(jì)學(xué)意義并不顯著的“證據(jù)”,或者使用對隨機(jī)變量完全不適用且毫無信息量的統(tǒng)計(jì)指標(biāo),比如推斷肥尾變量的均值或者相關(guān)性。這一點(diǎn)源于:

(i)統(tǒng)計(jì)學(xué)教學(xué)上對高斯分布和其他薄尾變量的強(qiáng)調(diào)。

(ii)死記硬背統(tǒng)計(jì)術(shù)語的時(shí)候缺乏對統(tǒng)計(jì)知識的理解。

(iii)對于維度性質(zhì)毫無概念。

上述幾條在社會科學(xué)研究者中很常見。

偽經(jīng)驗(yàn)主義的例子有:比較恐怖襲擊或埃博拉病毒等流行病的致死率(肥尾)和從梯子上跌落的死亡率(薄尾)。

這種看似實(shí)證的“實(shí)證主義”是現(xiàn)代科學(xué)研究中的一種頑疾,在多維和肥尾條件下完全失效。

實(shí)際上,我們并不需要區(qū)分肥尾和高斯隨機(jī)變量就可以看出這種行為的不嚴(yán)謹(jǐn)性:沒有達(dá)到簡單的統(tǒng)計(jì)顯著性標(biāo)準(zhǔn)——這些操作者也不理解顯著性這個概念。

2.2.16 前漸進(jìn)性

數(shù)學(xué)上的統(tǒng)計(jì)研究一般聚焦于當(dāng)n=1(n為求和的數(shù)目)和n=∞的情況。而真實(shí)世界正是處于中間的那部分——這也是本書的核心。部分分布(方差有限)對于n=∞的漸進(jìn)極限是高斯分布,但是對于n很大又不為無窮的情況并不成立。

2.2.17 隨機(jī)化

將確定性變量隨機(jī)化的方式有兩種:(i)較為簡單的二元方法;(ii)通過更復(fù)雜的連續(xù)或離散分布實(shí)現(xiàn)。

(i)假設(shè)s為確定性變量,我們以雙狀態(tài)伯努利分布來進(jìn)行隨機(jī)化(入門級別),假定以概率p取s1,概率1-p取s2。該變換以ps1+(1-p)s2=s的形式保留了變量的均值s,當(dāng)然,我們也可以通過相同的方式保留變量的方差,等等。

(ii)我們可以使用一個完整的統(tǒng)計(jì)分布,雙尾條件下一般是高斯分布,單尾條件下一般是對數(shù)正態(tài)分布或指數(shù)分布(很少會用冪律分布)。當(dāng)s為標(biāo)準(zhǔn)差的時(shí)候,我們可以隨機(jī)化s2,它變成了“隨機(jī)波動率”,該波動率的方差或標(biāo)準(zhǔn)差一般被稱為“Vvol”。

2.2.18 在險(xiǎn)價(jià)值(VaR),條件在險(xiǎn)價(jià)值(CVaR)

對于某隨機(jī)變量x,分布函數(shù)為F,某參數(shù)λ,VaR的數(shù)學(xué)表達(dá)為:

然后,相應(yīng)λ下的CVaR或預(yù)期損失ES為:

或者反過來在正的定義域上,考慮X的正向尾部。

一般來說,參數(shù)k的預(yù)期損失為

2.2.19 風(fēng)險(xiǎn)共擔(dān)

風(fēng)險(xiǎn)共擔(dān)是一種過濾機(jī)制,強(qiáng)迫做菜的廚師品嘗自己做的食物,讓他們暴露在自身問題的風(fēng)險(xiǎn)之中,這樣一來就可以將危險(xiǎn)分子驅(qū)逐出去。能夠“風(fēng)險(xiǎn)共擔(dān)”的領(lǐng)域包括:管道維修、牙齒診療、外科診療、工程建造,這些領(lǐng)域的從業(yè)者以有形的工作成果被外界評估,在職業(yè)生涯斷送或破產(chǎn)的風(fēng)險(xiǎn)下從事職業(yè)活動。無法“風(fēng)險(xiǎn)共擔(dān)”的領(lǐng)域包括:互相引用的學(xué)術(shù)界。學(xué)術(shù)領(lǐng)域的從業(yè)者只依賴同儕的相互評估而非從真實(shí)世界中獲得反饋。

2.2.20 MS圖

MS圖(maximum to sum)表示最大單一觀測對某階矩的貢獻(xiàn)(隨著n不斷變大),我們可以觀察到大數(shù)定律的行為。對隨機(jī)變量X來說,在MS圖上觀察給定樣本的高階矩表現(xiàn)是一種判定的收斂性的簡易方法[或者看看是否存在]。其中一種做法如圖10.3所示。

根據(jù)對變量極大值的統(tǒng)計(jì),MS圖的原理正是大數(shù)定律[184]。對于獨(dú)立同分布的非負(fù)X1,X2…Xn,假設(shè)對于,那么隨著

這里為求和函數(shù),然后為極大值函數(shù)(對于存在負(fù)值的隨機(jī)變量X,我們也可以采用取絕對值的形式來求奇數(shù)階矩)。

2.2.21 最大吸引域(MDA)

極值分布考慮的是隨機(jī)變量的最大值,當(dāng)(分布的“右端點(diǎn)”)在最大吸引域上[116],也可以表示為:

2.2.22 心理學(xué)文獻(xiàn)中的積分替換

心理學(xué)文獻(xiàn)中經(jīng)常有如下混淆:假設(shè)為某一閾值,f(.)是概率密度函數(shù),并且是超過K的概率,g(x)是影響函數(shù)。定義I1是超過K之上的期望收益:

而I2是K處的影響乘以超過K的概率:

這里很容易混淆的是I1和I2,g(.)在K以上是常數(shù)的時(shí)候[比如,階躍θ函數(shù)]兩者相等。對一階導(dǎo)為正的g(.)來說,I1和I2只有在薄尾分布下才比較接近,在肥尾條件下會相去甚遠(yuǎn)。

2.2.23 概率的不可分拆性(另一個常見誤區(qū))

定義是導(dǎo)數(shù)為f的概率分布,以及是測量函數(shù)或“收益函數(shù)”,那么對于的子集

在離散分布下,假設(shè)概率質(zhì)量函數(shù)π(.):

這里的思想在于,概率只是積分等式中的核,而不是決策之外的最終結(jié)果。

2.2.24 維特根斯坦的尺子

“維特根斯坦的尺子”是一個哲學(xué)比喻:我們是在用尺子量桌子還是在用桌子量尺子?這主要取決于結(jié)果。假設(shè)存在兩種分布:高斯分布和冪律分布,我們認(rèn)為,當(dāng)出現(xiàn)一個超大偏差的時(shí)候,比如“6個標(biāo)準(zhǔn)差”事件意味著原分布屬于冪律分布。

2.2.25 黑天鵝

總的來說,有些事件在你的預(yù)期和建模能力之外,而且其效應(yīng)極為顯著。好的方法不是去預(yù)測它們,而是對它們產(chǎn)生的影響呈現(xiàn)出凸性(至少不是凹性):我們能了解自身對某類事件的脆弱性,甚至可以對其量化衡量(考量二階影響和結(jié)果的非對稱性),但是想對它們做可信的統(tǒng)計(jì)處理基本上是癡心妄想。

這一點(diǎn)向來很難跟建模人員解釋清楚,我們需要和從未見過(甚至從未想過)的事物共處,但事實(shí)就是這樣。正如保羅·波爾泰西常說的(這里可能是正確或是誤用了他的話)那樣:“你從未見過分布的另一面。”

注意認(rèn)知的維度。黑天鵝和觀察者相關(guān):火雞的黑天鵝對屠夫來說是白天鵝。9·11恐怖襲擊事件對受害者來說是黑天鵝,但對恐怖分子不是。這種觀察者依賴是一種中心化的性質(zhì)。一個所謂的“客觀”的黑天鵝概率模型不僅不存在,而且是對其自身意義的消解,因?yàn)樗陨砭驮谏⒉バ畔⒌牟煌陚湫浴?/p>

灰天鵝:統(tǒng)計(jì)性質(zhì)上穩(wěn)定、低頻且有重大影響的大偏差被稱為“灰天鵝”。當(dāng)然,“灰”的程度取決于觀察者:冪律分布使用者的灰天鵝對困在薄尾框架體系下的天真的統(tǒng)計(jì)學(xué)家來說就是黑天鵝。

重申一下:黑天鵝不是肥尾,只是肥尾會讓它們變得更糟糕。肥尾和黑天鵝的聯(lián)系在于,肥尾區(qū)域的大偏差會放大黑天鵝的影響。

2.2.26 經(jīng)驗(yàn)分布會超出經(jīng)驗(yàn)

經(jīng)驗(yàn)分布的生存函數(shù)定義如下,假設(shè)X1,X2…Xn為獨(dú)立同分布實(shí)隨機(jī)變量,具有共同的累積分布函數(shù)F(t)。

這里是指示函數(shù)。

由格利文科-坎泰利定理可知,無論初始分布如何,最大范數(shù)都會收斂到單一分布,可以通過科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)來驗(yàn)證:

這種和分布無關(guān)的收斂性主要考慮的是概率,而不是矩——本書作者由此出發(fā),探究了最大值之上的“隱藏矩”。

我們可以看到如下結(jié)果(因?yàn)橹罉O值為0和1,頓斯科將其進(jìn)一步轉(zhuǎn)化為布朗橋):

“經(jīng)驗(yàn)分布會超出經(jīng)驗(yàn)”的意思是,經(jīng)驗(yàn)分布一定會出現(xiàn)在某區(qū)間[xmin,xmax],此時(shí)肥尾分布會帶來巨大的問題,因?yàn)槲覀儾皇窃诟怕士臻g,而是在收益空間分析肥尾。

更進(jìn)一步的內(nèi)容見隱藏的尾部(下一小節(jié))。

2.2.27 隱藏的尾部

假設(shè)Kn為n個獨(dú)立同分布隨機(jī)變量樣本的最大值,Kn=max(X1,X2…Xn),假設(shè)X分布的密度函數(shù)為,我們可以將矩分解為兩部分,在K0以上的部分為“隱藏矩”。

這里μL是分布中可觀察的部分的矩,而μK是隱藏部分的矩(大于K)。格利文科-坎泰利定理告訴我們,μK,0應(yīng)該和X的分布無關(guān)。但是這一條對高階矩并不成立,所以科爾莫戈羅夫-斯米爾諾夫檢驗(yàn)在這里存在問題。

2.2.28 影子矩

影子矩在本書中被稱為通過“插入式”估計(jì)來求解的矩。它不是直接用可觀察的樣本求均值,而是通過對分布參數(shù)進(jìn)行最大似然估計(jì)(如使用最大似然參數(shù)尾部指數(shù)α)得出影子均值。因?yàn)樵诜饰矖l件下直接可觀察的樣本均值存在偏差。

2.2.29 尾部依賴

假設(shè)X1和X2是兩個不一定為同分布類型的隨機(jī)變量,假設(shè)是概率為q的逆CDF,也即,上尾依賴可以定義為:

下尾依賴的定義與此類似。

2.2.30 元概率

通過將變量隨機(jī)化這樣的技巧來比較兩個不同的概率分布。或是隨機(jī)化某個參數(shù)以得到對應(yīng)的分布,如看漲期權(quán)價(jià)格,VaR、CVaR等風(fēng)險(xiǎn)指標(biāo),并檢驗(yàn)結(jié)果分布的魯棒性或凸性。

2.2.31 動態(tài)對沖

標(biāo)的為S,到期時(shí)間為T的歐式看漲期權(quán)C的收益可以通過如下動態(tài)對沖的方法得到復(fù)制,在當(dāng)前時(shí)間t和T之間:

我們將時(shí)間區(qū)間分成n個,這里的對沖比率是在時(shí)刻計(jì)算的,但是我們在股票上得到的是對沖時(shí)刻和之間的價(jià)格差。

理論上,的時(shí)候會使上式收斂到確定性收益。在高斯世界中,上式為伊藤-麥肯積分。

但在這里我們看到,在肥尾條件所伴隨的漸進(jìn)性質(zhì)下,這樣的動態(tài)復(fù)制完全不可能實(shí)現(xiàn)。

主站蜘蛛池模板: 罗田县| 靖宇县| 哈尔滨市| 昌都县| 资源县| 莫力| 池州市| 米泉市| 兰溪市| 遂宁市| 岳普湖县| 霍林郭勒市| 乐业县| 绥化市| 淮滨县| 海丰县| 博乐市| 比如县| 陆良县| 蓝山县| 顺义区| 垣曲县| 故城县| 巨鹿县| 鄂伦春自治旗| 浏阳市| 青岛市| 宜兴市| 延边| 桐柏县| 淮北市| 广宗县| 喀喇| 横峰县| 辽宁省| 上饶市| 永定县| 新河县| 庐江县| 合阳县| 高密市|