- 算法交易:制勝策略與原理(珍藏版)
- (美)歐內(nèi)斯特·陳
- 3131字
- 2025-08-27 15:34:12
1.3 統(tǒng)計學(xué)在回測程序上的應(yīng)用:假設(shè)檢驗
在任何回測系統(tǒng)當中,我們所面臨的問題是如何將有限樣本的規(guī)模確定在合理的水平,比如,無論我們計算的統(tǒng)計指標是什么,諸如平均收益率,還有最大跌幅等,它們都具有隨機性;換句話說,如果我們的交易策略碰巧在小規(guī)模的數(shù)據(jù)樣本驗證之下取得不菲的收獲,那我們就會很幸運,統(tǒng)計學(xué)家因之而開發(fā)了一種通用的方法,即假設(shè)檢驗,用以實現(xiàn)前述的目標。
具體地講,應(yīng)用于回測系統(tǒng)當中的假設(shè)檢驗基本框架遵循如下的幾個步驟:
(1)基于某個有限的樣本數(shù)據(jù)的回測系統(tǒng),我們需要計算一個特定的統(tǒng)計測度值,我們稱為假設(shè)檢驗統(tǒng)計量。具體地講,假設(shè)檢驗統(tǒng)計量就是在一定時間序列內(nèi),某個特定交易策略相關(guān)的日平均收益率。
(2)我們設(shè)定基于無限序列數(shù)據(jù)而生成的真實日間平均收益率為零,此種前提條件被稱之為“零假設(shè)”[9]。
(3)我們設(shè)定日間收益率的概率分布是已知的,即基于“零假設(shè)”的理念,相應(yīng)概率分布的均值為零。接下來,我們就要闡述如何確定此種概率分布。
(4)基于零假設(shè)的概率分布理念,我們設(shè)定:平均日間收益率至少不能低于回測系統(tǒng)中的觀測值——對此概率,我們用p來表示(對于一般的檢驗統(tǒng)計來說,在極端情況下,檢驗統(tǒng)計所對應(yīng)的概率可能出現(xiàn)負值的情況)。我們將概率p稱為假定值,如果p值極?。ū热缧∮?.01),那就意味著我們可以“拒絕零假設(shè)”,同時,從統(tǒng)計意義上講,回測系統(tǒng)中的收益會顯現(xiàn)得非常明顯。
以上所論的關(guān)鍵在于第三個步驟,那么,在零假設(shè)的情境之下,我們將如何確定相應(yīng)的概率分布呢?我們可以假設(shè):相應(yīng)日間收益率服從一個標準參數(shù)的概率分布,比如高斯分布,即均值為零,標準差以樣本數(shù)據(jù)的日間收益率之標準差為準,如此則表明,如果相應(yīng)回測系統(tǒng)具有較高的夏普比率,那么,對我們來說,放棄零假設(shè)就不那么困難了,這是因為按照高斯分布的相關(guān)理念,標準統(tǒng)計檢驗量正是均值除以標準差,再乘以相應(yīng)點數(shù)的平方根(Berntson,2002)。同時,各種臨界點的p值均列于表1-1中,例如,在回測系統(tǒng)當中,如果相應(yīng)日間夏普比率乘以天數(shù)的平方根的值大于等于臨界值2.326,那么,相應(yīng)的p值就會小于等于0.01。
表1-1 日間夏普比率×(n為天數(shù))所對應(yīng)的臨界值

資料來源:Berntson(2002)。
上述假設(shè)檢驗的方法和我們的理念是一致的,即追求高夏普比率的策略在統(tǒng)計學(xué)的意義上具有更加明顯的效果。
預(yù)期零假設(shè)的概率分布的另一種方法是應(yīng)用蒙特卡羅模擬方法生成模擬的歷史性價格數(shù)據(jù),再將這些數(shù)據(jù)填充至我們的交易策略之中,然后以實證的方式確定相應(yīng)收益的概率分布,而我們的理念是:相關(guān)交易策略的盈利模式不僅僅依賴于前期瞬時的價格分布,也能夠捕捉一些微妙的情境或者相應(yīng)價格序列的相關(guān)系數(shù)。所以,如果我們在實際價格數(shù)據(jù)所對應(yīng)的初始時刻及相同時間步長之內(nèi)生成多元的模擬數(shù)據(jù),然后在這些模擬的價格序列之中運行相應(yīng)的交易策略,那么我們會發(fā)現(xiàn):這些序列價格所對應(yīng)的收益率之均值p將大于等于回測系統(tǒng)所生成的收益率。而比較理想的p值應(yīng)該足夠小,從而使我們可以摒棄“零假設(shè)”的條件限制,否則,應(yīng)用相應(yīng)策略所產(chǎn)生的平均收益則只能參照相關(guān)金融市場的收益率。
預(yù)期“零假設(shè)”之概率分布的第三種方法是由安德魯·羅和他的合作伙伴提出的(羅、馬梅斯蓋、王,2000),此種模式不是對價格數(shù)據(jù)進行模擬估計,而是對一系列交易進行模擬,同時規(guī)定了相應(yīng)的約束條件,即實際的多空交易單數(shù)與交易持續(xù)的平均時間步長都要和回測系統(tǒng)中的數(shù)據(jù)相吻合,同時,相應(yīng)的交易應(yīng)該是在真實的歷史性價格數(shù)據(jù)支持之下隨機生成的。然后,我們需要測定相應(yīng)一組交易的平均收益率是否大于等于回測系統(tǒng)所生成的平均收益率。
例1-1中,我在一個特定交易策略的情境之下,將回測系統(tǒng)相關(guān)的三種統(tǒng)計模式進行了比較,對于不同的檢驗結(jié)果,我們沒有必要大驚小怪:因為不同情境之下的概率分布是不同的,同時,相應(yīng)交易策略所設(shè)定的概率分布在不同情境之下所遵循的隨機標準也是不一樣的。
例1-1 期貨動量交易策略的假設(shè)檢驗
我們在這里應(yīng)用前述三種假設(shè)檢驗的版本進行相關(guān)的檢測,其中每種方法所應(yīng)用的零假設(shè)條件具有各自不同的概率分布,交易策略相關(guān)的回測結(jié)果之標的資產(chǎn)是將在第6章探討的TU數(shù)據(jù)庫中的各類期貨,而相應(yīng)的交易策略是:在該期貨收益率為正時買入(在收益率為負時賣出),同時,期貨合約的持有時間為1個月。我們遴選相應(yīng)策略的宗旨不只是“簡約”,也要賦予其一個固定的持有期,而對第三種假設(shè)檢驗策略而言,我們需要將相應(yīng)的多空交易之初始日期隨機化,且持續(xù)時間步長也要隨機化。
假設(shè)檢驗的第一種方法很簡單,我們所設(shè)定的日間收益率的概率分布服從高斯分布,即均值為零——其符合零假設(shè)的前提條件,而標準差以回測系統(tǒng)中的日間收益率的標準差為準。如果我們用ret來表示策略相關(guān)的日間收益率T×1型MATLAB?矩陣,則相應(yīng)的統(tǒng)計檢驗數(shù)值為:

一 ,其中mean表示均值,std代表標準差,length為收益率所對應(yīng)的時間步長?!g者注
如果相應(yīng)數(shù)據(jù)集合的數(shù)值是2.93,與表1-1中臨界值的統(tǒng)計檢驗數(shù)據(jù)相對照,則顯示我們可以摒棄零假設(shè)的約束條件,且置信概率在99%以上[10]。
第二種假設(shè)檢驗的方法是處理一系列隨機模擬的期貨日間收益率數(shù)據(jù)(不是交易策略相關(guān)的日間收益率),其所對應(yīng)的天數(shù)與回測系統(tǒng)之時間步長是一致的,同時,相應(yīng)的隨機日間收益率數(shù)據(jù)應(yīng)該與期貨實際收益率的觀測值具有相同的均值、標準差、偏度與峰度。但是,它們之間內(nèi)嵌的相關(guān)系數(shù)不需要統(tǒng)一。如果我們發(fā)現(xiàn)一個比較理想的概率,在其情境之下,應(yīng)用相關(guān)交易策略所獲取的收益不輸于或好于隨機的收益以及實際收益的觀測值,那么,這并不意味著所謂的動量交易策略能夠捕捉任何行情或收益,其之所以盈利是因為我們比較幸運,即攫取的收益率的觀測數(shù)值所生成的概率分布恰巧具有一個特定的均值和分布形態(tài)。為了在規(guī)定的時刻內(nèi)生成模擬的隨機收益率的相應(yīng)數(shù)據(jù),我們可以從MATLAB系統(tǒng)中的統(tǒng)計軟件內(nèi)選取那些服從皮爾遜分布的隨機數(shù)來創(chuàng)建相應(yīng)的函數(shù);在模擬收益率marketRet_sim生成之后,我們根據(jù)其變化創(chuàng)建模擬的價格序列cl_sim;最后,我們根據(jù)相應(yīng)價格的變化運行相關(guān)的交易策略,同時計算該策略項下的平均收益率。我們需要模擬10000次,然后統(tǒng)計有多少次因此策略而產(chǎn)生的平均收益大于等于實際的觀測數(shù)據(jù)。
我們假設(shè)相應(yīng)收益率為相關(guān)期貨日間收益率的T×1型的行列矩陣,那么,相應(yīng)關(guān)鍵性的程序編輯語言如下:[11]


通過運行上述程序,我們發(fā)現(xiàn):對隨機收益所進行的10000次的模擬過程中,有1166次策略相關(guān)的平均收益率大于等于實際的收益觀測值,那么,否定零假設(shè)的概率條件只有88%——很明顯,收益率分布曲線的形態(tài)與相應(yīng)策略的成功與否是相關(guān)的(注意:交易成功與否和收益率分布中的均值點位的相關(guān)性不大,因為在不同的時間序列,多、空持倉的頭寸是不確定的)。
第三種假設(shè)檢驗的方法涵蓋了隨機進行的多、空交易的入場日期,同時,回測系統(tǒng)之中,多單與空單的數(shù)量是一致的,其實,我們可以通過MATLAB系統(tǒng)的隨機函數(shù)很容易地完成此類工作,編輯語言為:

在以100000個樣本為標的的程序運行過程中,沒有一個單獨的策略相關(guān)的樣本收益率能夠大于等于實際觀測值,這說明第三種假設(shè)檢驗的方法對相關(guān)策略的認可度不足。
零假設(shè)的方法不是唯一的,不同的零假設(shè)理念將會產(chǎn)生不同統(tǒng)計學(xué)意義上的數(shù)值,因此許多評論家認為此種方法存在瑕疵(吉爾,1999);此外,我們也確實想知道:相應(yīng)觀測到的測試數(shù)據(jù)R能否使零假設(shè)檢驗的條件概率值等于p(H0|R)[12]。然而,在我們之前所闡述的程序當中,因計算相應(yīng)的測試數(shù)據(jù)R而生成的條件概率值為p(R|H0),而p(R|H0)=P(H0|R)的情境不多。
即使假設(shè)檢驗以及摒棄零假設(shè)理念的方法可能不是一個非常令人滿意的具有統(tǒng)計學(xué)意義的評估方法,但是當對零假設(shè)理念的拒絕無效時,則可以生成許多非常有趣的情境,在例1-1中,我們可以發(fā)現(xiàn):收益率分布曲線的峰度變高時,應(yīng)用動量交易策略則可以產(chǎn)生理想的效果。