官术网_书友最值得收藏!

1.3 有保留地相信回測結(jié)果

我們擁有歷史數(shù)據(jù),可以用于回測建模,然后將其用于目前的新市場環(huán)境交易,我們給這種行為起了一個(gè)聽起來“高大上”的名字:量化投資。似乎一切波動(dòng)都可以用定量方法完全解讀,可以封殺一切風(fēng)險(xiǎn)暴露,只取得利潤,其實(shí)不然。

早在1900年以前,查爾斯·亨利·道(Charles Henry Dow)就已經(jīng)創(chuàng)立了股票市場平均指數(shù)——“道瓊斯工業(yè)指數(shù)”。他們引入了移動(dòng)平均線這種分析方法。當(dāng)時(shí)的歷史價(jià)格數(shù)據(jù)質(zhì)量很差,只能通過紙質(zhì)出版物印刷保存。但是基本的指數(shù)編訂、權(quán)重規(guī)則、移動(dòng)平均動(dòng)量分析方法,已經(jīng)被引入了,這就是典型地想通過定量化分析來預(yù)測市場和戰(zhàn)勝市場的表現(xiàn)。

所以通過回測構(gòu)建模型是一門古老的融合學(xué)科,甚至包括很多對于市場運(yùn)行規(guī)律的不尊重(金融數(shù)據(jù)研究屬于非實(shí)踐性科學(xué))。回到本章節(jié)主體,我們?yōu)槭裁匆嘈呕販y結(jié)果,能否相信回測結(jié)果,甚至將其應(yīng)用到未來的實(shí)際投資中?

主要原因是,模型運(yùn)行在樣本數(shù)據(jù)(歷史數(shù)據(jù),in-sample部分),我們相信樣本數(shù)據(jù)能夠在一定程度上反應(yīng)總體數(shù)據(jù),特別是真實(shí)數(shù)據(jù)(樣本外實(shí)盤數(shù)據(jù),out-of-sample部分)。樣本容量過小,則樣本對總體缺乏足夠的代表性,從而難以保證推算結(jié)果的精確度和可靠性,所以歷史數(shù)據(jù)不足的問題不容忽視。訓(xùn)練模型首先要獲取盡可能多的歷史數(shù)據(jù),然后假設(shè)歷史數(shù)據(jù)能夠盡可能推斷未來走勢,這是我們做量化投資相信回測結(jié)果的基本假設(shè)。

可以閱讀一下技術(shù)分析理論的三大假設(shè)(市場行為包容消化一切信息、市場運(yùn)行以趨勢方式演變、歷史會(huì)重演),或者道氏理論的三大假設(shè),從這里尋找一些可以輕松理解的答案。實(shí)際上我初入這個(gè)行業(yè)時(shí),心中也是抱定信念,堅(jiān)信這些假設(shè)成立。雖然后來隨著研究發(fā)現(xiàn)某些假設(shè)并不十分穩(wěn)固,但是這些假設(shè)還是很有市場的,并且交易者愿意按照其指導(dǎo)自己的操作。

回到剛才所說樣本和總體的關(guān)系,我們將此問題轉(zhuǎn)到統(tǒng)計(jì)學(xué)角度來分析,既然手中的數(shù)據(jù)是樣本,那么我們要分析研究對象(股票和期貨價(jià)格)的變化程度和所要求或允許的誤差大小,在不同的模型中這兩點(diǎn)要求不一樣,但是總體來看,樣本永遠(yuǎn)無法滿足要求,且現(xiàn)實(shí)數(shù)據(jù)變化較大,所以我們僅能獲取到粗略統(tǒng)計(jì)結(jié)論。

因此一定要有保留地相信回測結(jié)果,而不是按照回測結(jié)果達(dá)到多少年化收益率和勝率等績效指標(biāo),就認(rèn)為實(shí)盤中也能達(dá)到如此結(jié)果,實(shí)盤和回測一定是有偏差的(當(dāng)然我們都希望實(shí)盤比回測績效更好,但是很遺憾這種情況很少出現(xiàn))。

所以需要注意:我們是用模型效果在樣本數(shù)據(jù)上推測真實(shí)數(shù)據(jù)也按照此規(guī)則運(yùn)行,一切前提都在數(shù)據(jù)端,如果數(shù)據(jù)一旦不按照此規(guī)則運(yùn)行,則模型隨數(shù)據(jù)變化程度而衰減甚至失效。如圖1-10所示。

圖1-10 矩陣推進(jìn)(walk-forward)建模方法適用于數(shù)據(jù)量巨大的高頻領(lǐng)域

在承認(rèn)衰減是必然的之后,模型開發(fā)者希望績效盡可能少地衰減,但是無論使用什么數(shù)據(jù)切分方法、矩陣推進(jìn)(walk-forward),都只是在樣本內(nèi)部說明你的模型對于數(shù)據(jù)有較好的適應(yīng)能力,此時(shí)我們希望得到的結(jié)果是,在訓(xùn)練和測試部分,資金曲線都有較好的上升斜率,并保證了相似的交易次數(shù)(交易密度驗(yàn)證)。如圖1-11所示。

圖1-11 隨著樣本量增加,樣本特征趨近于總體,所以我們永遠(yuǎn)面臨樣本不足

當(dāng)我們站在更遠(yuǎn)的時(shí)間點(diǎn)看現(xiàn)在(手中的回測數(shù)據(jù))時(shí),會(huì)認(rèn)識(shí)到再長時(shí)間的測試樣本,依然只是樣本而不是總體。高盛公司數(shù)量策略部門的董事總經(jīng)理Emanuel Derman認(rèn)為:樣本和總體相似,但這種相似性也是有限的。僅以回測數(shù)據(jù)建模,導(dǎo)致模型缺少深刻的結(jié)構(gòu)和堅(jiān)實(shí)的原理。大部分傳統(tǒng)的權(quán)益模型專注于數(shù)據(jù)之上,這是一個(gè)危險(xiǎn)的現(xiàn)象。

我們的回測報(bào)告只是逼近模型在實(shí)盤階段的表現(xiàn),或者說近似說明該模型有哪些風(fēng)險(xiǎn)收益特征。相信回測并不等于死板地恪守,要看清回測的實(shí)質(zhì)。

除了認(rèn)識(shí)到樣本僅是總體的一部分概率表示之外,還要考慮以下這樣幾個(gè)問題:

(1)樣本內(nèi)數(shù)據(jù)的交易規(guī)則、交易成本、市場參與主體是否和目前的實(shí)盤一致?

(2)在樣本內(nèi)數(shù)據(jù)上,單筆交易的利潤貢獻(xiàn)是否平穩(wěn),還是說來自于少數(shù)高盈利的交易?

(3)樣本內(nèi)數(shù)據(jù)的不同周期波動(dòng)率,是否和目前的市場波動(dòng)率相似?

(4)樣本內(nèi)數(shù)據(jù)是否質(zhì)量低下,以及政策過度干預(yù)?

以上幾個(gè)問題如果出現(xiàn)了和目前市場不符的情況,則要人工地過濾掉一些和目前不符的模型或參數(shù)配置或品種配置。如果你是一個(gè)資深交易者,則可以通過對市場規(guī)則的熟悉來完成過濾,如果你是一個(gè)細(xì)心的數(shù)據(jù)分析師,則可以將數(shù)據(jù)對應(yīng)到基本面在歷史上發(fā)生的變化來實(shí)現(xiàn)過濾。

如圖1-12所示,實(shí)盤績效可以看作是預(yù)測數(shù)據(jù),這部分?jǐn)?shù)據(jù)隨時(shí)間運(yùn)行偏差越來越大,這是接下來我們要通過模型對抗的核心問題。它嚴(yán)重干擾著量化投資行業(yè),使得我們即使做出可以回測盈利的模型,在實(shí)盤也實(shí)盤無法跑贏市場,甚至出現(xiàn)較大績效衰減。我們在本書中的不同地方會(huì)提到解決方案,也會(huì)給出我們的建議。

圖1-12 用時(shí)間序列預(yù)測誤差理解回測和實(shí)盤績效

以上問題都是說起來容易,做起來需要高度專注和長時(shí)間付出才可以完成。我盡可能說出這些內(nèi)容,希望縮短投資者建立長期盈利模型的時(shí)間,各位讀者要在數(shù)據(jù)分析方面下功夫。也只有盡量避免各種不利的數(shù)據(jù)影響,我們才能在更大程度上相信回測結(jié)果。

量化投資的危險(xiǎn)之處在于,目標(biāo)函數(shù)在推動(dòng)你從數(shù)據(jù)里挖出黃金,也在放大噪聲的影響力,所以到了某個(gè)奇怪的交易規(guī)則設(shè)置臨界點(diǎn)下,模型由噪聲主導(dǎo),得到的完全都是幸存者偏差。事實(shí)上定量管理的核心問題和導(dǎo)致模型奔潰的主要原因,正是在于對歷史數(shù)據(jù)的過度依賴,市場環(huán)境的變化可能導(dǎo)致股票、期貨市場運(yùn)行模式的改變,所以我們要相信回測結(jié)果,在一定程度上也要嘗試走在市場前面,預(yù)判性地應(yīng)對風(fēng)險(xiǎn)。

主站蜘蛛池模板: 滕州市| 呼伦贝尔市| 香格里拉县| 抚宁县| 苍南县| 仁怀市| 应用必备| 通化市| 明水县| 贵溪市| 曲松县| 澜沧| 渭源县| 兴海县| 宜昌市| 桃源县| 鲁山县| 东至县| 竹北市| 营山县| 闽清县| 康定县| 应城市| 游戏| 新龙县| 故城县| 湄潭县| 山阴县| 连江县| 治县。| 库尔勒市| 吴江市| 凤山县| 临洮县| 梨树县| 嘉定区| 嘉祥县| 梁山县| 新宁县| 大余县| 泰安市|