- 成為數據分析師:6步練就數據思維
- (美)托馬斯·達文波特
- 10711字
- 2019-01-24 16:42:13
引言
數據決策時代,人人都是分析師
我們生活在一個數據泛濫的時代。數據正以驚人的速度在增長,每個人的下一秒都會被更多的數據包圍。我們收集數據的主要目的是完善企業、政府和社會層面的決策制定機制。因此,如果我們無法通過定量分析,利用數據實現更好的決策制定,就是對數據資源的浪費,也有可能造成不良后果。因此,本書致力于為你展示定量分析的運作方式,以及該如何利用定量分析做出更好的決策,即使你沒有相關知識背景,也無妨。
數據,創新產品與服務的源泉
數據的力量正在各行各業中崛起。如果你熱愛運動,那肯定知道《點球成金》(Moneyball)這部電影,影片主角奧克蘭運動家棒球隊總經理比利·比恩(Billy Beane)利用球員的表現數據和分析學革新了職業棒球運動。現在,這種革新已經延伸到了所有的主流體育項目當中。如果你喜歡玩在線游戲,可能知道星佳(Zynga)和美國藝電(Electronic Arts),這些社交網絡游戲公司正在收集并分析用戶所有的游戲行為。那電影呢?你也許知道奈飛(Netflix)可以利用算法預測你可能喜歡的電影,好萊塢的一些制片人會利用算法來推斷什么樣的電影投資回報率高,美國獨立電影公司相對論傳媒(Relativity Media)就是這么做的。
數據種類各不相同。有的數據因為事務性用途被收集和管理,比如,企業和機構通過跟蹤員工上班時間和剩余假期所得的數據。當企業收集到大量數據之后,就希望能讀懂這些數據,并在此基礎上做出決策。同樣地,也可以利用分析學來研究與人力資源相關的事務性數據,企業可能會提出“下一年度有多少員工可能會退休”或者“員工休完所有的假期和其年度績效考核之間是否存在關聯”之類的問題。
不過,數據和分析學的作用并不局限于完善內部決策的制定。像谷歌、Facebook、亞馬遜和eBay等許多立足于互聯網的企業,都在利用收集網上交易數據所形成的大數據來支撐決策制定以及為客戶提供新產品和服務。無論你是想實現更富成效的內部決策,還是想為客戶提供更具價值的產品,分析學必不可少,它會對數據進行匯總、分析,并找出其中的含義和內在關聯。要讀懂并挖掘出數據的價值,必須借助數學或統計分析,簡單地說,就是分析學。
人人都是分析師
數據分析的本質
一般情況下,我們所說的分析是指,使用大量數據、統計和定量分析、解釋和預測模型以及基于事實的管理來推動決策過程與實現價值增生。
根據分析的方法和目的,分析可以被劃分為描述性分析(descriptive analytics)、預測性分析(predictive analytics)和規范性分析(prescriptive analytics)。描述性分析包括數據收集、整理、制表、制圖以及描述正要研究的事物的特征,這類分析以往被稱為“報告”。描述性分析可能非常有用,但它不能解釋某種結果出現的原因或者未來可能會發生的事情。
預測性分析不僅可以對數據特征和變量(可以假定取值范圍的因素)之間的關系進行描述,還可以基于過去的數據預測未來。預測性分析首先會確定變量之間的關聯,然后基于這種已知關聯預測另一種現象出現的可能性,比如在看到某個廣告后,一位消費者可能會去買產品的可能性。雖然預測性分析中的預測是基于變量之間的關聯做出的,但這并不代表預測性分析都需要明確因果關系。事實上,準確的預測并不一定需要基于因果關系。
規范性分析是更高層次的分析,如實驗設計和優化等。就像醫生會在處方上建議患者采取什么行動一樣,實驗設計試圖通過做實驗給出某些事情發生的原因。為了能夠在因果關系研究中信心飽滿地做出推斷,研究人員必須妥善處理一個或多個獨立的變量,并有效控制其他無關的變量。如果處于實驗環境下的測試組的表現大大優于對照組,決策制定者就應該立即推廣這種實驗環境。
優化是規范性分析采用的一種方法,指試圖識別出一個特定變量與另一個變量之間理想的關系水平。例如,我們可能會對識別最有可能讓產品實現高收益的價格感興趣。同樣地,優化這種方法能夠識別出使零售企業最大限度避免缺貨情況的庫存水平。
根據分析采用的方法以及收集和分析的數據類型,我們可以將分析分為定性分析(qualitative analysis)和定量分析(quantitative analysis)。定性分析的目的是深入了解某種現象出現的根本原因和誘因。非結構化數據通常是從少數非代表性案例中收集而來,并進行了非統計性的分析。定性分析是分析的最初階段,它通常是探索性研究的有效工具。定量分析是指通過統計、數學或計算的方法對現象進行系統的實證研究。通常情況下,結構化數據是從大量典型案例中收集而來,并進行統計分析。
為了服務于研究者的不同研究目的,存在以下幾種類型的分析:
·統計學:收集、整理、分析、說明和呈現數據的學科。
·預測:根據已有數據,預測一些感興趣的變量在未來某個特定時間點的情況。
·數據挖掘:通過使用算法和統計技術,自動或半自動地提取大量數據中未知的有趣模式。
·文本挖掘:用類似于數據挖掘的方式從文本中得出模式和趨勢的過程。
·優化:在同時滿足約束條件的情況下,按照某些標準,利用數學方法來尋找最優的解決方案。
·實驗設計:給各組隨機分配被試,然后使用測試組和對照組來推導出特定結果中存在的因果關系。
雖然此處給出了一系列常用的分析方法,但在使用的過程中,會不可避免地出現相當大的重疊。例如,回歸分析(regression analysis)是預測性分析中最常用的方法,與此同時,它也是統計學、預測和數據挖掘中常用的方法。此外,時間序列分析(time series analysis)是用于分析數據隨時間變化的一種具體統計方法,在統計學和預測中也經常被用到。
上文提到的支撐人力資源決策的事務性數據是定量分析的結構化數據,其數據量相對較小,即使是大型企業,可能也就只有1TB或2TB。過去,分析就是發生在這樣的環境中,因此,就讓我們將其稱為“小數據”吧。過去,分析學別無選擇,必須針對小數據。
現如今,令大企業、非營利性組織和小型初創公司激動不已的是大數據。大數據是大量的非結構化數據,其來源極為廣泛,可能來自互聯網上的在線交談,或者攝像機的連續鏡頭,或者醫院患者的DNA分析。這類數據量非常龐大,甚至達到拍字節(PB)的程度。比如,谷歌每天要處理24 PB的互聯網數據;美國電話電報公司(AT&T)每天要轉換30 PB的語音和數據通信數據。如今,通過新型軟件和硬件技術,我們可以分析大數據并挖掘出其蘊涵的意義。
人人都是分析師
數據即未來
大數據一詞指的是數據量異常龐大且多種多樣的非結構化數據。以下是一些例子:
·社交網絡游戲公司星佳每天要處理超過1 PB的游戲數據。
·YouTube用戶每天觀看超過10億小時的視頻。
·Twitter用戶每月進行320億次搜索。
·2011年,谷歌用戶每天進行近50億次搜索。
·2009年,全球每天發送的短信超過25億條。
·2010年,世界各地的手機使用量達到50億臺。
·經過全面分析,一個人類基因組包含大約1TB的數據。
·評估一頭奶牛健康狀況的無線傳感器每年會傳輸200 MB的數據。
·2008年,連接到互聯網的設備的數量超過了全球人口的總量。
·據思科系統公司(Cisco Systems)估計,20種常見的家用電器產生的上網流量超過了所有互聯網用戶在2008年間產生的上網流量之和。
·麥肯錫咨詢公司預測,在美國的各行各業,職工超過千人的企業存儲的平均數據比美國國會圖書館(Library of Congress)的數據還要多。
大數據和分析學會改變各行各業的商業職能。任何組織或個人只要搶先一步掌握大數據,就會奠定至關重要的競爭優勢,就像在小數據時代占據先機進行數據分析的人能在競爭者中脫穎而出一樣。因此,企業和組織機構必須抓住大數據的歷史機遇。
大數據的潛能之所以能得到激發,是因為計算和數據收集設備的普及,而傳感器和微型處理器即將無處不在。基本上,任何機器或電子設備都會遺留下有關性能、位置和狀態的數據,而這些設備及其用戶通過在互聯網上的溝通又催生了一個海量數據源,當所有這些數據與由其他媒介,如無線和有線電話、電報、衛星等媒介生成的數據結合起來時,數據的未來豈止于大。
如果所有這些數據都可用,就意味著基本上所有的企業和組織行為都可以被視為大數據問題或者大數據行為。在制造業內,大部分機器設備已經配置了一個或多個微處理器,大數據的氛圍越來越濃烈。隨著消費者的選擇日趨多樣化,市場推廣早就成為一種大數據行為。谷歌也將其無人駕駛汽車項目定性為大數據項目。
許多企業的首席執行官曾公開表示,分析性思維和決策制定是企業成就和個人財富的來源,其中凱撒娛樂集團(Caesars Entertainment)的首席執行官加里·拉夫曼(Gary Loveman)就曾說過:“我們思考了嗎,或者說我們知道結果了嗎?”亞馬遜首席執行官杰夫·貝佐斯(Jeff Bezos)曾說過:“我們對數據來者不拒!”領英聯合創始人兼董事長里德·霍夫曼(Reid Hoffman)也曾說過:“Web3.0就是數據。”
各行各業的企業都應意識到數據的肆虐來襲,它們需要能對其進行詳盡分析的人,這類人雖然有著不同的稱呼,卻有著同樣的身份,那就是數據分析師(quants)。不過,《成為數據分析師》并不是為這些十八般分析武藝樣樣精通的人所著。本書的目標受眾是能基于分析結果制定出好決策并采取行動的人,這些人雖然是企業內部的非定量分析人員,但需要基于定量數據和分析來開展工作并制定決策。
一場探秘數據之旅
我和托馬斯的學術背景雖然有所不同,但闡述這個話題的目的相同,都是希望擴大分析性思維在商業和社會層面的運用,特別是幫助非數據分析師更好地利用數據。托馬斯自身也不是真正意義上的數據分析師,事實上,作為有著學術背景的社會學家,他的統計能力相對薄弱,不過,在分析學以及分析學在商業領域上的運用,他就是權威。幾十年來,他一直致力于就如何培養分析能力進行調研、創作、教學和企業咨詢。他一直與管理者共事,而通過幫助他們利用分析學所得的工作經驗正是本書的創作基礎。此外,他還是暢銷書《數據分析競爭法》(Competing on Analytics)和《數據化變革》
的第一作者,這兩本書聚焦大企業是如何利用分析學制定商業策略的。不過,在《成為數據分析師》這本書中,他將注意力轉移到了個人身上,關注個人如何培養分析技能,確定分析方向。
金鎮浩(此處是達文波特的筆述)的商務和統計學學術背景注定他是一名真正意義上的數據分析師。他一直在研究如何利用分析方法解決商業和社會領域的眾多問題,還創建并運營了一個教育項目,以培養個人的分析技能。在韓國,金鎮浩是一位商務和統計學教授,出版了6本著作,其中《100個統計學常識》(100 Common Senses in Statistics)和《怪誕統計學》(Freak Statistics)旨在幫助非統計學家更好地理解和通曉統計知識。
此書旨在幫你更好地利用數據,更深諳分析學之道。有了此書,與數據分析師共事將不再那么艱難,在與他們就其所進行的分析對話時,也有可能碰撞出火花。此書還能讓你學會定量分析的行話,讓你問出行內人該問的問題。說不定,你也會變成數據分析師呢!
數據分析師如何從0到1
企業管理者能通過多種方式,與企業內部的定量分析師親密合作,利用分析學提升決策制定的效率。讓我們看看最近珍妮弗·喬伊(Jennifer Joy)在美國保險公司信諾(Cigna)制定的一項決策。喬伊是臨床手術部門(Clinical Operations)副總裁,她管理著該公司龐大的客戶服務中心。該客戶服務中心幫助信諾的客戶增強體質,特別是有慢性病、需要長期治療的客戶,比如患有糖尿病和心臟病的客戶。喬伊本是一名護士,并不是分析師。不過,她讀過MBA,也篤信分析性思維的重要性。她的案例展示了分析性思維的兩個方面:定性問題和找出問題的正確答案,她的這種分析性思維幫助公司和客戶節約了大量成本。
喬伊的工作面臨的一個首要決策是,該花多長時間在客戶的慢性病管理上,也就是告訴他們如何預防疾病或者如何防止疾病的擴散。一方面她想確保自己確實有幫助到客戶,另一方面還要合理控制公司的成本。對于她來說,主要的結果變量就是信諾的客戶是否入院或再入院。一度,她手中有幾十頁的月度報表,里面記載著客戶再入院的頻率,這個頻率時高時低,但到底是什么引起了它的波動,喬伊不得而知。“我掌握了很多數字,但它們只是數據而已,不能回答深層次的問題,即‘這說明了什么’。”喬伊真正想知道的是,客戶打電話給信諾之后,在身體健康和住院這兩個問題上,到底有沒有獲得答案。
為了更深入地了解慢性病管理和住院率之間的因果關系,喬伊向信諾的一些分析學專家尋求幫助。邁克爾·科辛斯(Michael Cousins)和其同事組成了一個分析團隊,由科辛斯牽頭與喬伊一起深入探究這個問題。科辛斯說:“喬伊雖然并不是全然理解因果關系背后的各種推理細節,但是,她是一個邏輯性強、愛鉆研的人,而且提出的問題非常睿智。她對定量分析并不是那么敏感,但非常注重分析。與像她這樣的決策制定者共事,分析團隊打著燈籠也難找。”
在信諾,科辛斯的團隊專注于讓分析方法和業務需求相匹配。他的團隊認同喬伊的觀點,即有關住院情況的數據派不上什么用場,因為它并沒有回答喬伊提出的因果關系問題:在客戶的健康狀況和住院這兩個問題上,臨床醫生的建議到底產生了什么樣的影響。換言之,已有的報表采用上下波動的方法并不適用于解決她所提出的業務問題,因為在決策制定的過程中,沒有可靠的對比或者參照組作為基礎。比如,原來那些報表并沒有根據客戶病情的輕重情況進行配對,有的病人的病情會更危急一些,有的則會緩和一些。于是,科辛斯的團隊創建了一種病例配對方法,將健康狀況、人口統計數據、生活方式和住址相近的患者進行配對。然后,每一對配對成功的客戶中的一人將接受慢性病管理與督導,而另外一個人則不接受,如此一來,喬伊就能確定這種管理和督導的效果到底如何了。科辛斯指出:“對喬伊來說,去調研這些干預是否真的有效是需要勇氣的,因為這畢竟是她公司的主要業務,但她為了找出真相,義無反顧。”
結果表明,客戶服務中心提供的有些干預對很多疾病來說,并不能達到預期的效果,但在喬伊他們意想不到的一些疾病上,卻又卓有成效。對于前一組客戶,喬伊決定采取行動,縮短患有特定疾病的客戶的通話時間,直到確定客戶服務中心提供的服務為客戶帶來效用為止。對于后一組客戶,他們則增加和調遣了客服人員,以為客戶提供更具附加值的活動。喬伊還和科辛斯的團隊在其他分析項目上進行了合作,包括對照實驗(controlled experiment),以測試不同的督導方法,比如與客戶的醫生進行更深入地接洽。在究竟哪種方法會奏效這一問題上,她并沒有依靠直覺去判定,而是堅定地遵循結構化分析的理念,比如說利用“測試與獲知”(test and learn)這類大數據分析分法,每年進行二三十次測試來判定。
喬伊原本就擅長分析,現在,通過和專業人士的合作,她又掌握了分析工具,可以將所思所想付諸實踐,然后做出以事實為依據的決策。雖然通過電話為客戶提供醫療服務的理想方式依然有待發掘,但至少現在,信諾將更多的精力放在了事實證明有效的方法上,減少了花在那些確實不起作用的方法上的冤枉錢。對于科辛斯和其團隊來說,也在與喬伊和信諾其他善于分析的高管的合作中獲得了好處,他們變得更善于用商業術語表述分析結果,傳達分析對于客戶和經濟效益的意義。
因此,《成為數據分析師》并不是為像科辛斯這類分析人士所作,而是奉獻給全球如喬伊這類具有分析頭腦的人的。不過,我們并不是說希望你變成一位技藝了得的定量分析師或者數據科學家。首先,這不是單單通過讀這一本書就能實現的,這需要大量的積累和學習;其次,并不是每個人都喜歡這一行,也不是每個人都有這個能力。
事實上,我們就是想讓你具有數據化思維或者分析頭腦,即對數據和分析有渴求,在工作中利用它們做決策,并在公司內部提倡這種做法。我們希望人們對你的評價是“他對數據富有激情”,或者如同評價喬伊這樣:“雖然她自身不是什么數據極客,但她理解并欣賞他們的工作。”我們雖然沒打算讓你從事什么復雜的數據分析工作,但希望你成為它的消費者,而且是精明的消費者,利用它來制定決策,提出與數據和分析方法相關的問題,理解分析結果并利用其提升你的企業業績。改述哈佛大學統計系孟曉犁先生的話來說就是,借由這本書,我們并不是想讓你成為專業“釀酒師”(他為統計學博士講課時用了這個詞),只是想讓你成為美酒行家。
過去,如果對分析的創建過程了解不充分,就很難有效地利用分析。不過,如今情況大有改觀。就像做一個好司機一樣,你不需要知道內燃機的工作原理,大多數情況下,在利用統計數據制定決策時,你也無須知曉統計數據是如何計算的。現在,越來越多繁重的工作是由分析軟件來未完成的,有時它甚至需要根據你的數據和參數的屬性,自行決定應該進行哪些統計分析。更有甚者,一些新的分析軟件,比如SAS公司的軟件具備一種叫“什么意思”(what does it mean)的功能,它能簡單明了地解釋相關的意義或闡述統計預測采用的是哪種計算方法。
雖然時代呼吁我們充分利用分析,但迄今為止,還沒有一本以通俗易懂的語言對其進行詳細闡述的書籍來幫助新手掌握分析技能。《成為數據分析師》描述了分析是什么,并用眾多真實案例展示如何將分析付諸實踐,并為讀者提供了提升分析能力的方法。本書能幫助你更深入地理解分析,并提供就問題的分析解決方案與企業內部人員進行有效溝通的方法。
分析型決策,更精準的決策
企業和組織的決策制定可能會基于眾多因素,包括個人經驗、直覺、實驗或者分析和數據。就像電影《點球成金》中分析在職業棒球上的運用一樣,并不是說有了分析,成功就有了保障;電影中的奧克蘭運動家棒球隊當時并未能拿下整個賽季的所有比賽,之后也未出現過在整個賽季中無敗績的情況。然而,利用分析學的人還是占據了一定的優勢,正如奧克蘭運動家棒球隊一樣,球隊大牌少得可憐,但其表現總是超乎人們的想象。當然,不能排除也有決策制定者單純依靠經驗和直覺就能制定出好的決策,特別是當他面臨的是自己經常碰到的問題時。
幾乎各行各業的現實情況都表明:分析型決策制定更精準,而且會產生更好的決策效果。在職業棒球中,幾乎所有的球隊都在使用奧克蘭運動家棒球隊首創的分析方法,甚至是曾經為自己挑選隊員并以非分析型方法和比賽策略引以為傲的紐約揚基隊(New York Yankees),現在也聘請了21位棒球統計學家。
在商業領域,傳統數據分析主要用于支撐企業內部決策,并回答如這樣的決策問題“這個產品我們應該賣多少錢”或“什么樣的促銷活動有可能讓某個客戶購買我們的產品”。在大數據背景下,分析常用于為客戶提供新產品或為已有產品開發新功能,如谷歌搜索引擎的網頁排名算法,社交網站領英上的“你可能認識的人”“我應該與哪些人交往”的功能,或者星佳開發的新游戲。這依然是一種決策形式,不管該決策是企業自身做出的還是由消費者做出的。在這本書中,我們會列舉出很多案例,如政府部門、醫療保健和體育行業等都可以從中受益。
當一個決策者評估備選決策時,會基于兩種信息源對這一決策進行考量:來自定量分析的信息和來自非定量分析的信息。非定量分析的信息是指來自直覺、經歷、經驗法則、傳聞和猜測等途徑的信息。這些信息有時是有用的,但也存在眾多問題。即使你在決策制定方面擁有很多經驗,但經驗的弱點是,它并不具備普適性;猜測總是存在風險;一般情況下,你也不應該相信直覺,而大多數人過于看重直覺,并視其為決策制定的指南。比如,行為經濟學就認為,在處理經濟問題時,人們顯然不是一個好的直覺型決策制定者。能通過分析來制定的商業決策有很多,見圖0-1。

圖0-1 可以通過分析來制定的商業決策
盡管分析有很多好處,但它并不是決策制定的萬能法寶,有些情況并不適合使用分析來制定決策。如果是無關緊要的或者與個人偏好相關的決策,就沒必要浪費時間和精力去收集并分析數據了。另外,如果你必須迅速做出決定,可能就沒有時間去采用什么分析方法。如果你需要制定的是一個一次性的決策,可能會覺得如此麻煩地收集數據、建立分析模型并不值得。總之,適合采用分析方法來制定的決策是那些需要反復制定,能夠留出一些時間進行分析,而且足夠重要,并對得起花費的人力和物力的決策。
3個階段、6個步驟,人人都能成為高效的決策者
《成為數據分析師》的核心部分描述的是分析性思維的三個主要階段。全書用三個章節分別對分析性思維的三個主要階段進行了詳細描述,同時給出了一些分析實例,這些案例都有一個特點,就是其中有一個特定的分析階段對整個分析工作來說至關重要。圖0-2展示了這三個主要階段以及每個階段采取的分析步驟。

圖0-2 定量分析的3個階段和6個步驟
第1章講述的是分析性思維的第一階段,即構建問題。構建問題的目的是確定分析工作要回答什么問題,以及基于這個問題的答案要做出什么樣的決策。構建問題是一個非常重要的步驟,因為如果問題是錯的,就算收集再多的數據和進行再復雜的分析,你也無法得到正確的結論。構建問題有兩個步驟,一個是識別問題,另一個是回顧之前的發現。在第1章中你會看到,一旦你認為自己已經認識了某個問題并確定用分析方法來解決它,那你很可能會發現別人已經解決了這個問題的某些方面,而這通常能幫你更好地構建問題。
第2章重點論述了分析性思維的第二階段,你可能會認為這個階段是分析工作中最重要的階段,即解決問題的階段。在這個階段,需要確定模型中采用的變量,并收集測量這些變量的數據,然后實實在在地進行數據分析。如果你自己不是一位定量分析師,且沒打算成為定量分析師,那么大部分工作你可能會和定量分析師一起開展。然而,對于你來說,知道哪部分工作是重要的且熟悉操作過程仍然是非常有用的。雖然你也許無法獨立解決問題,但你提出的問題和提供的見解會大大有助于定量分析師得出一個更好且更有效的解決方案。
第3章著眼于第三階段,也就是最后一個階段,這個階段和其他兩個階段同等重要,卻往往被忽略,即傳達結果并基于結果采取行動。你如何傳達分析結果是至關重要的,因為這直接關系到這個分析結果是否會導致某種行動。如果一位決策制定者(也許就是你)不理解分析師所做的工作和分析結果代表著什么,那么他就不會樂意基于這個分析結果來制定決策。如果真是這樣,那么前面兩個階段的工作你就白做了,還不如不做。我們生活在一個博眼球的時代,因此以一種妙趣橫生、能夠吸引注意力的方式傳達分析結果是非常重要的。你不能以紙上談兵的方式來展示你的報告,更不要期望任何人會被這樣的報告打動,而應基于報告上的內容采取相應行動。
接下來的章節將著眼于與分析性思維相關的一些特定問題。其中,第4章討論的是如何在分析工作中發揮創造力,這兩者水火不相容。第5章給出了一些幫助你培養分析能力的方法,當然,前提是你要有這種想法。
第6章描述了一些需要用到分析的非定量分析人員與定量分析師一起有效工作并達成更好的決策的好方法。不用說,這肯定是一種互惠互利的合作方式。全書列舉了大量來自各行各業的分析案例,展示了分析是如何被用來解決問題的。書中也提供了一些詳細注明了如何應用分析的操作單,還有部分內容強調了立即進行分析性思維的簡單方法。
人人都是分析師
一個輕率的決策足以毀掉一家巨頭企業
無論是正面案例還是反面案例都能讓我們獲益,但是反面案例往往更令人印象深刻,所以我們不妨來舉一個反面例子。喬·卡薩諾(Joe Cassano)的例子應該是最令人印象深刻的了,幾乎可以說是他一個人摧毀了一家巨頭企業,甚至是美國乃至世界經濟。真是見鬼!
卡薩諾到底做了什么,以及他沒弄清楚的究竟是分析工作的哪個部分呢?對于卡薩諾其人,我們一提他的頭銜,你可能就會有點印象,他原是保險巨頭美國國際集團(AIG)旗下的一個由400余人組成的全資子公司,即金融產品公司(AIGFP)的首席執行官。他目睹了一筆數額巨大的金錢的流失,雖然確切的金額仍有爭議,但差不多就是850億美元,因為美國納稅人從自己的腰包里掏出來用以幫助金融產品公司維持經營和清償債務的錢就是這么多。雖然要為這筆金錢的虧損負責的不僅是卡薩諾一人,但正如專門揭發名人丑聞的記者馬特·泰比(Matt Taibbi)在《滾石》(Rolling Stone)雜志中寫到的一樣,他是導致“全球經濟衰退的第一感染源”。泰比還描述卡薩諾為“一個又矮又胖、長著豆子眼且前額過分突出的布魯克林大學畢業的禿子”,不過這不是我們關心的問題。畢竟,如果他不是讓金融產品公司虧了這么多錢,而是賺了不少錢的話,我們相信他的形象不會這么糟糕。
那么,分析和定量分析到底是在什么地方起作用,或者更精確地說,到底是在什么地方缺少了分析和定量分析?金融產品公司之所以虧損了這么多錢,是因為它出售了一種名為信用違約互換(Credit Default Swap,簡寫為CDS)的金融產品,換言之,就是提供信用違約保險,保險標的是為抵押貸款支持衍生品的價值。格蕾琴·摩根森(Gretchen Morgenson)是《紐約時報》的記者,他在這些事情發生不久之后指出:“雖然美國的房市崩盤經常被認為是導致金融危機的原因,但事實上,是因為以信用衍生品而著稱的錯綜復雜的金融合約為債務持有人提供違約保險,造成了金融體系的脆弱不堪。這些金融合約悄悄地流行開來,并避開了監管者的監管視線,有時候甚至是賣這些金融合約的企業高管都不明白這些金融合約到底意味著什么。”
卡薩諾顯然就是不明白這些金融合約的高管中的一員。事實上,衍生品和信用違約互換都是基于數學和統計學的復雜的金融產品,但不幸的是,就如最后的結果所證明的一樣,是基于錯誤的數學和統計學知識。如果辦理了按揭貸款的借款人不再具有償還貸款的能力,衍生品便將變得一文不值,而金融產品公司就會被迫支付給投保人衍生品的保險價值。說到這里,一切也就明朗了,事情就是這么發生的。
邁克爾·劉易斯(Michael Lewis)在《名利場》一書中描述了金融產品公司業務部存在的核心問題:
金融產品公司的交易員說,金融產品公司是為何以及如何從一顆搖錢樹變成一場巨虧災難的原因有些錯綜復雜,但金融產品公司從興盛走向衰落的起點卻非常簡單,就是管理層的變化導致了決策制定方式的變化。2001年年底,該公司的第二任首席執行官湯姆·薩維奇(Tom Savage)退休了,薩維奇在位時的二把手卡薩諾被提拔為首席執行官。薩維奇是一名訓練有素的數學家,對金融產品公司交易員用來進行風險定價的模型了如指掌,從而能夠確保合理的風險定價。薩維奇還喜歡針對金融產品公司的各種業務模型和指標進行辯論。然而,卡薩諾幾乎不懂數學,且對辯論不太感興趣。
卡薩諾并不關心潛在風險的評估以及定價模型是否準確。他沒有意識到開發出這些模型的美國國際集團和華爾街的分析師們提出的棘手問題,只是把大量的信用違約互換出售給任何愿意為之買單的人。信用違約互換是建立在這些申請了低質量抵押貸款的人有能力償還貸款的基礎之上的。卡薩諾好像從來就沒想過這個假設可能是錯誤的,也有可能他確實想到過這種可能性,但并不為之擔心。
對于新手來說,通過自學以提高分析能力并非易事。我們已經搭建了一個網站:http://keepingupwiththequants.weebly.com,讀者可以在這個網站上詢問分析相關的知識、技術或者正亟需解決的特定問題。在這個網站上,請暢所欲言,你可以提出任何問題。該網站也對本書中描述過的一些案例進行了詳細分析,我們偶爾也會在本書中借鑒這個網站上的內容。

想知道托馬斯·達文波特最推崇的三種分析法嗎?
掃碼獲取“湛廬閱讀”APP,
搜索“成為數據分析師”查看彩蛋。

什么是彩蛋
彩蛋是湛廬圖書策劃人為你準備的更多驚喜,一般包括①測試題及答案②參考文獻及注釋③延伸閱讀、相關視頻等,記得“掃一掃”領取。