- 另類數據:投資新動力(數字經濟系列03)
- 王聞 孫佰清
- 1499字
- 2025-08-08 15:15:35
電話會議記錄
在前面的三個文本數據案例中,推特推文反映了普通投資者的情緒,財經博客反映了財經專家的情緒,而財經新聞則體現出記者們的情緒。在這個小節所介紹的文本數據案例中,我們將討論另外一類文本數據中的情緒,也就是公司電話會議記錄中體現的管理層情緒。這個案例來自于ExtractAlpha和AlphaSense這兩家公司的分析師Jha/Blaine(2015)。
財務文件的文本分析在學術研究中已有經年,包括Loughran/McDonald(2011)針對美國公司年報10K和季報10Q的文本分析,以及Henry(2008)針對公司會議記錄進行的文本分析,Kearney/Liu(2014)對此做了一個很好的綜述。當前這個案例所說的財務電話會議記錄(earnings call tanscript),其來源是因為公司股東分散各地,因此經常需要通過電話進行會議,而這些會議過程通常會錄音,形成文字后就是電話會議記錄了。
大多數財務報告(10K和10Q)表現為數值數據以及標準模板陳述的文字,其中很少涉及情緒方面的表達,其中和情緒最為相關的管理層討論和分析,也只占財報中很小一部分。和財報相比,公司的電話會議記錄更具自發性,格式更為隨意,特別是問答部分,在現場實時環境下,管理層必須要做即席的回答。在這個案例中,我們可以捕捉管理層在應對股東提問中所體現的情緒,特別是股東問題本身所蘊含的情緒。在Loughran/McDonald(2011)的研究中,他們就依托于一個針對特定文件中語言使用方式相關的詞典。針對電話會議記錄中的情緒,專注于市場智能研發的AlphaSense就開發了一個針對電話會議記錄的正面和負面詞匯的詞典。這個案例分析的電話會議記錄數據是由湯森路透提供的,最早可以追溯到2005年。Jha/Blaine還對慧甚提供的電話會議記錄數據進行了類似的分析,結果得到了在性質上近似的結論。
作者分析的時段是從2005年到2014年,所覆蓋的股票要求滿足流動性的要求,[22]由此在不同的樣本時段上就得到了1400~1800個的股票樣本。在這個案例的文本情緒分析中,Jha/Blain(2015)把重點放在了會議記錄語調(tone)這個指標上。根據AlphaSense開發的針對電話會議記錄的正面和負面詞匯的詞典,就可以得到語調的定義:

在樣本中語調的數值介于-0.04和0.62之間,中位數是0.25。一個電話會議記錄的語調值是0.25,就意味著這個文件中正面詞語的句子要比負面詞語的句子多出25個句子。在這個樣本中,很少存在語調為負的情況。不同時期的語調分位數是非常穩定的,除了在金融危機發生的時候出現明顯的下跌。圖1.8給出了每月語調第10、25、50、75和90百分位數的變化。
圖1.8 語調百分位數的時間序列

資料來源:Jha/Blaine(2015)。
下面分析語調變化的投資含義。圖1.9所示為各種不同語調變化帶來的累積剩余收益。我們可以看到,在公告日當天不同的語調變化存在著明顯的股票收益率差異,正如所預期的那樣,越正面的語調變化就會存在更大的股票回報。如果我們不知道公司電話會議的具體實踐,或者會議記錄的發布存在著延遲,那么就無法獲取當日的股票收益。另外,在第二天之后,語調變化帶來的收益變化不是很大,除了最為負面的語調變化,后者會出現股票收益在未來兩個月內持續下跌的狀況。
圖1.9 從會議記錄日開始基于語調變化的剩余收益

資料來源:Jha/Blaine(2015)。
接下來我們在投資組合場景下討論語調的影響。作者分別從全體股票樣本、大盤股、中盤股和小盤股的分類出發,分別構造基于語調變化的股票十分位投資組合,然后通過做多最高十分位和做空最低十分位的組合形成多空組合,由此得到表1.7的結果。從中可以看出,由此形成的市場中性組合收益率是適中的,但是對于大盤股和中盤股而言這個組合的投資業績是不多的,當然對于小盤股而言,投資業績就很一般了。就這個結果,作者也指出,對于小盤股而言,電話會議的內容在時間上的變化很大,因此語調的季度自相關系數就很低,這樣語調的變化就更多是噪聲,而不是由于電話會議參與者對公司前景看法的變化導致的。
表1.7 基于語調變化因子的多空組合績效
