官术网_书友最值得收藏!

第1章 量化投資入門建議與行業概況

1.1 學習路線圖與重要知識節點

2016年我被一個問題困擾了很久,一位讀者朋友請我提供量化投資學習的“路線圖”,或者說進入這個行業的學習路徑。我從來沒有思考過這個問題,自己和身邊從事量化工作的同事都沒有想過知識圖譜是如何構建的,又是以哪里作為突破口構建的。后來我意識到問題的嚴重性,如果路線圖制定得當,學習效率將會得以提高;如果制定不妥甚至錯誤,則可能會使學習者幾年時間毫無進展。

在調研了多位量化交易者之后,我總結出量化投資學習方面的路線圖,如圖1-1所示。

圖1-1 量化投資學習路線圖

(1)體會各類資產的擇時建模,激發學習興趣。

各類資產的擇時問題較難且有深度,但是也相對簡單,因為門檻低,“低買高賣”思路非常清晰。在單一時間序列模型上,動量容易被均線類、突破類模型捕捉,典型應用是股票指數擇時。相信很多讀者最初也是被一條能夠跑贏大盤指數的資金曲線所吸引的。

在個股上擇時較為困難,除了少數大盤股有較為持續的動量之外,大部分中小盤股票不容易做擇時,很容易追高買入,并在不利點位賣出。擇時的工具簡單多樣,比如移動平均線、布林通道,各類技術指標如MACD、RSI之類基本上就是因為能擇時才擁有廣泛的“群眾基礎”。

將這些指標加工處理后,配上止損、止盈條件,即可直接應用于商品期貨市場,該市場的中低頻交易策略大部分以動量類技術指標為主,原理并不難理解,也有部分技術指標可以反向使用,作為“超買超賣”類指標來表示過度乖離。擇時在外匯類資產上也能大量使用,基本上也是將商品期貨的模型搬運過去,然后做適當修改。在進行大類資產配置時,由于擇時工具面對更低的數據噪聲,往往效果更好,使用一個邏輯簡單的模型去應對債市或者房地產市場相關數據,能帶來令人驚訝的效果。

這個階段的研究進度因人而異,有一定基礎的研究者可能幾周即可找到能賺錢的擇時模型,而大部分交易者可能需要數月甚至數年時間來培養對動量的把握能力,或者因為基本的編程語言關口無法通過而停留在這一階段。

(2)編程語言障礙要在模型開發中逐一克服,否則會陷入對程序的恐慌和無助。

編程語言對大部分交易者來說是量化學習的攔路虎(對于少部分程序員而言,金融市場知識和分析經驗可能更復雜),建議積累必要的語法知識后,直接從模型搭建開始學習。比如我們能夠調用系統自定義函數,獲取按規則選取的股票池,就走出了策略撰寫的第一步,然后嘗試構建最基本的交易策略、買賣條件,這時就需要嵌套、循環、邏輯判斷等知識。再向復雜的領域推進,可能要涉及對個股表格做篩選、計算等“增刪改查”的處理,需要接觸Python語言的list、dict、dataframe等數據格式。

如果一個缺乏編程知識的人為了學習量化投資而學習MATLAB或Python,可能需要至少一個月甚至數月的時間。而且在面對實際的股票問題時會再度陷入僵局,因為需要從腦中將抽象的代碼規則轉化成實際問題,以看懂某個語句;或者需要一定時間將股票、期貨數據格式,抽象成一行代碼,這一過程來回消耗精力,很多人在這一過程中會忘記學習量化的初衷。

我們在面對海量的新知識時都會產生敬畏和莫名的恐慌情緒,不過在代碼學習過程中不用擔心,畢竟它是輔助我們更好地進行投資決策的工具,它要簡化模型構建過程,而非讓問題復雜化。學習復雜的程序開發有一個好辦法——寫注釋,閱讀大量投資模型,為它們逐行添加注釋,有必要時再對照敲擊一遍代碼,你的代碼能力會得到快速提升。如圖1-2所示。

圖1-2 量化投資是金融知識用編程表達后的結果,兩種能力都要具備

(3)探索股票和期貨波動特征,嘗試較為復雜的股票和期貨模型。

具體到可以被量化交易的各類交易資產方面,建議大家在股票和期貨上重點研究,而不要輕易涉及外匯資產和數字貨幣,因為股票和期貨這兩類市場都有足夠的容量可以交易,且杠桿率可控,資金安全有保障。

首先股票是沒有杠桿的,而且市場上有很多只股票可以選擇,每只股票又帶有大量財務因子信息、量價和資金因子信息、輿情信息,這促使股票類資產可以調換標的操作,并且調倉是以日期為橫截面的。我們不必抓住幾只股票反復操作,因為在固定標的上,只有擇時收益,可以反復調倉換股,獲得多只股票的收益。

事實上你會發現:如果你不換股,在單獨股票上使用擇時模型,則難以跑贏靜態持有個股,而到了期貨市場上,積極主動的擇時交易、突破類交易,都可以獲得良好收效。用幾個看似簡單的邏輯構建模型,在期貨市場波動率充足的情況下,可以始終保持盈利,所以大部分交易者入行量化領域,真正實盤程序化交易模型并不是從股票開始的,而是從期貨開始的,特別是資金需求量較低的商品期貨。如圖1-3所示。

圖1-3 遺傳算法(Genetic Algorithm)作用于股指期貨,分為訓練集(左側)和測試集(右側)

在這個階段,你會遇到很多聽起來黑科技感十足的模型,比如低通濾波器、隱馬爾可夫鏈、模式識別等,要學習的知識會多到“爆炸”,但是如果本著技不壓身的初衷將它們都學完并做成模型,或許你依然難以盈利,這是很令人煩惱的問題,因為擇時問題的深度會限制你的眼界和看市場的廣度,所以先給自己打造出能用的工具,然后再去追求“高精尖”的知識也不遲。

建議大家給自己半年到一年時間,為了加速進度、督促自律,可以列一個任務清單和時間表,定期學習、總結經驗。

(4)做足單因子分析功課,然后切換到多因子學習。

在過渡到本階段之前,你需要補充一些數學知識,比如線性回歸、數據清洗等,因為在股票市場上,要面對的不僅是期貨時間序列,還有每只股票時間序列背后的多維度信息。初學者可以想象,在大智慧或同花順軟件上看到上市公司F10資料里有多少信息,在因子分析階段就要涉及多少信息(甚至遠比這更多),可謂任務繁重。如圖1-4所示。

圖1-4 樣本內與樣本外因子選擇的比較

資料來源:德銀量化部門QWAFAFEW Presentation January 2015

建議讀者按照科學的評估方法,觀察因子值對于個股收益率的描述能力,重點分析IC和因子收益率單調性,以便發現高質量的Alpha收益(超額收益)因子。做好數據清洗和數據表格的基本操作,才能到達多因子建模階段。

在多因子階段需要注意一點:做好數據處理工作,讓你的模型更加簡單有效和安全、易解釋,對算法知識可以淺嘗輒止,因為可供調用的算法包很多,這部分知識的深度也難以理解,消耗的學習成本過大。而且這樣能讓你更加集中精力做出能夠實戰的多因子模型,而不是沉浸在算法的知識中無法看清股票市場現狀。

主站蜘蛛池模板: 西丰县| 南京市| 高尔夫| 遂昌县| 务川| 安国市| 客服| 盐池县| 和田市| 射洪县| 彭泽县| 突泉县| 甘肃省| 阆中市| 古丈县| 贵定县| 赞皇县| 板桥市| 毕节市| 江口县| 霍城县| 湖口县| 蒙城县| 五家渠市| 张家港市| 措美县| 江都市| 赞皇县| 友谊县| 宾阳县| 聊城市| 灯塔市| 兴化市| 莱州市| 临潭县| 灵武市| 嘉义市| 宜兰县| 炎陵县| 吉首市| 北票市|