- 數據之巔:數據的本質與未來
- (英)洛倫佐·費爾拉蒙蒂
- 4906字
- 2020-07-02 17:39:40
相信數據
要在公共生活中建立有效的測量手段,需要采取一定程度的強制措施。例如,要在建筑領域執行共同標準,既要求私營企業遵守規定,也需要一支訓練有素的勞動力隊伍。同時,數據也是強有力的說服武器。借用法國哲學家米歇爾·福柯(Michel Foucault)對政府行使權力間接手段的分析,人們可能會認為,評估的“客觀”標準構建不僅使“其他人的監管或控制成為可能”,對“自我身份”的塑造還會“通過個人的自我認知和自我調節進行”。簡而言之,由數據制定規則比單純的自上而下強制要復雜得多:它包含了很大程度上的自滿情緒,并從根本上設計了主體的行為方式。總之,這是一個自愿默從的體制。因此,它成為福柯確認政府合理性或“政府性”的一個關鍵方面——也就是一項“引導行為”和從“一定距離”影響行為的技術;或者說,是按照“具體的結果”和“多種策略”來“處理事物的正確方式”。
數據也是界定現代官僚治理體系運作方式的基礎。新的知識模式確實對決策者的體制機構的定義至關重要,決策者的選擇必須由除行政自由裁量權之外的參數來指導。現代官僚制研究的先驅馬克斯·韋伯(Max Weber)認為,官僚主義的本質是技術的力量,它導致了所有與政治斗爭相關的非理性和情感因素的邊緣化,也就是人為因素逃脫了精確的計算。韋伯的想法強調“公共行政秩序能夠實現距離、合理性、客觀性、權威性,以及計算機制的方式”。歷史學家西奧多·波特一直在研究我們社會對數據信任的歷史演變,正如他所言,量化的演進過程與官僚政治的發展有著內在的聯系。出于法律和政治的原因,行政自由裁量權被人懷疑,“所以監管者別無選擇,只能不懈尋找事實,并盡可能地將它們減少到幾個決定性的數據”。特別是在像美國這樣的多元民主國家,利益集團爭奪在公眾中的地位以及參與決策的時候,基于統計的決策有助于調整政府、企業和整個社會的利益:“當價值觀的沖突與共識難以捉摸,數據和操縱它們的技術會因為它們表面上的中立性而被推崇。有了統計數據,激烈爭論的問題看起來似乎都會被馬上解決”。
在20世紀30年代的大蕭條時期,美國統計學家和經濟學家發現他們在公共決策中起到的作用呈現了指數級的增長。一系列的環境災難,特別是1927年的密西西比河大洪災,為基礎設施項目大量使用基于統計的風險評估方法創造了良好的條件,同時也為評估預防政策的成本和效益提供了初步研究。隨著經濟衰退,公共預算不斷縮減,“有限”的資源配置中引入了新手段的指導,以避免政治爭議。1936年,《防洪法》首次在公共政策中引入了成本效益分析,指出除非有防洪計劃能證明其效益超過成本,否則不會有任何計劃獲得聯邦資助。最初,成本效益方法的設計是為了鼓勵高度爭議部門的開放和中立,例如防止環境災難及其與公共基礎設施項目和工業化的關聯。當然,數據的可信度會在專業性、科學中立性和透明性的修辭中體現出來。在1936年《防洪法》中設置成本效益條款的參議員認為,負責這些項目計量經濟學分析的專家是“值得尊敬的、直率的、愛國的人”,因為新的評估體系需要“按照輕重緩急,做出獨立的、非政治性的、沒有偏見的決定”。由于這些人的專業知識和聲譽,負責處理數據的部門開始享有越來越大的影響力,這種影響力又反過來被用以增進與強大的私有利益及企業的友好關系。羅斯福政府內政部長哈羅德·伊克斯(Harold Ickes)表示,負責量化管理發展的官員是“華盛頓最有力、最雄心勃勃的游說團體”,與軍事分裂和“官僚制下最完美的部分”緊密聯系在一起。
在20世紀60年代和70年代,用于衡量成本和收益以及評估公共基礎設施項目有效性的各種模型,已經“從地方官僚體系中聚集起來,變成一套合理化的經濟原則”。在美國人對政府“經常性不信任”的政治背景下,統計分析的擁護者在各個領域都引入了這些工具,包括從社會福利項目的評估,到監獄的運作,等等。他們聲稱,這些工具在公共政策的計量經濟評估上“幾乎普遍有效”。特別是,成本效益分析和實驗測試程序開始由各種下屬機構和私營公司實施,這些機構和公司會將他們的專業知識出售給政府部門或招標公共項目的公司。正如波特強調的那樣,在這個階段,“科學、國家與大型行業的利益之間”存在明確的一致性。例如,盡管前美國總統尤利西斯·格蘭特(Ulysses Grant)于1877年向國會作出了一個著名的不成功呼吁,但美國國家標準局經常鼓勵政府和有關工業部門進行密切合作。格蘭特在呼吁中對私營部門的檢測和評估與國家要求的不同:“這些試驗不能由私人公司自身執行,不僅有費用的原因,還因為結果必須依賴無私利的人的權威。”
在20世紀90年代,量化評估的新做法成為“審計爆炸”的一部分。除了通過財務審計對私營公司會計進行監管外,還出現了“環境審計、效益審計、管理審計、法務審計、數據審計、知識產權審計、醫療審計、教學審計和技術審計等評估方式,它們帶來了不同程度上的制度穩定性和接受度”。《審計學會》一書的作者邁克爾·鮑爾(Michael Power)認為,會計制度進一步強化了人們對數據的關注,并鑄就了“理性化社會的神話結構”:“審計爆炸的根源在于組織生活的程序性重組,以及新的‘治理合理性’。”
這樣的重組給所謂的專家,也就是生成數據的個人和組織,產生了前所未有的影響。用德國心理學家格爾德·吉仁澤(Gert Gigerenzer)和他的同事們——《機遇帝國:概率如何改變了科學和日常生活》一書作者的話來說,專家的權威性因為統計和計量經濟計算結合到公共決策中,而得到了極大的提升:“事實上,數據的爆炸創造了一種新的專家,他們的主張更多依靠信息與形式技術,而不是具體的經驗或個人判斷。畢達哥拉斯賦予了數據如此大的影響力,這對于新型專家來說既是一種福音,也是一種誘惑。”把這些“新”專家的工作動員起來的標準化程序“與現代官僚制的公正性和規則相平行”,它們試圖排除“個人自由裁量權,強調既定程序的一致性和機械性應用,以避免偏見,一個針對事實,另一個針對公平”。
然而,大部分的審計報告并不傳達有價值的信息。對于外部用戶來說,它們不是基于證據的、不需加以說明的文件。總的來說,這些報告是自成一體的不透明記錄,從根本上依賴著“中立,客觀,冷靜,專業”的語言系統。這實際上意味著對公眾的全面披露、透明度和問責制是通過專家認證被限制的。審計過程因而成為一條捷徑,它建立在我們社會對專家根深蒂固的信任基礎上,而非理性的公共審議基礎:“這是問責制鏈條中的一個死胡同。”簡言之,更多的數據和會計制度并不一定等同于更好的問責制。相反地,它們會減少“公眾獵奇的心理和公開調查”,因為一個必要事實是,專業審計的最終用戶并不是廣大公眾,而是“專家話語中的虛擬參照點”。這也是計數的很多悖論之一。雖然審計爆炸發展是以問責的名義發生的,“給出賬目看起來卻像是一種避免問責的方式”,在這樣的情況下,數據扼殺了政治討論和社會討論,意圖提供不容置疑的事實。自相矛盾的是,“雖然審計學會宣稱的綱領性基礎是開放和問責,它卻有著日益封閉的危險。”
使用數據的專家成為社會信任的守護者。數據和守護者的權力從根本上顛覆了支撐社會和政治聯系的委托代理關系。公民、選舉代表和其他利益相關者(委托人)被專家(代理人)所控制。而基于數據的治理機制的深刻制度化進一步加強了數據的力量,因為“我們促成了各種輔助認證或可靠性擔保……這些很容易被操縱,但現在對于那些已經不懷疑新代理人的委托人來說,又是非常重要的東西”。我們都相信那些以數據為證據的人,即使我們知道,各種目的的數據造假都是如此容易。在學術研究領域,每年都會發現數百起數據篡改案例,甚至涵蓋了世界一流大學。當然,它們之中的大部分并不會成為世界性的頭條新聞,但確實有一些引起了轟動。比如說,在1986年,諾貝爾獎獲得者、生物學家戴維·巴爾的摩(David Baltimore)就因為卷入了一項涉嫌捏造數據的研究,引起了全球熱議。這些造假數據被用以支撐一項免疫系統研究中的新發現。盡管巴爾的摩最后擺脫了所有控告,他還是在這項懲戒中受到了一定打擊。在社會研究中,也有非常多相似的例子。歷史學家邁克爾·貝勒斯雷斯(Michael Bellesiles)的例子可謂是臭名昭著,他偽造了一份“獨特的”數據集,其中包含了數百年來美國民眾中小型武器的分布情況。他寫作的暢銷書《武裝美國》被《經濟學人》雜志稱頌,并獲得了久負盛名的班克羅夫特獎。而后,學術界發現了書中的數據造假,這也迫使貝勒斯雷斯放棄了獎項。
哈佛大學經濟學家卡門·萊因哈特(Carmen Reinhart)和肯尼思·羅格夫(Kenneth Rogoff)是《這次不一樣:800年金融荒唐史》這部金融危機史上影響深遠的著作的作者。2010年,他們發表了對美國國家經濟研究局(NBER)的后續研究報告。該報告很快成為所有鼓吹歐洲和美國緊縮計劃的政府和保守勢力的參考。歐盟委員奧利·雷恩(Olli Rehn)和美國共和黨議員保羅·瑞恩(Paul Ryan)都引用了這項研究。萊因哈特和羅格夫題為《債務時代的增長》的論文使用了“44個國家長達200年”的時間序列數據和“3700份年度觀察報告,其中涵蓋了廣泛的政治體系、制度、匯率安排及歷史情況”。其主要實證結論為,各國的政府債務不得超過GDP的90%,否則會自動引發經濟增長速度的變緩和系統性衰退的風險。之后,在2013年,馬薩諸塞大學阿默斯特分校的一名年輕學生被指派完成一項作業——重復一篇經濟研究領域著名論文的運算過程。他選擇了萊因哈特和羅格夫的這篇論文,因為每個人都熟知它在經濟危機的政治管理上具有的影響力。然而,在經過多次嘗試后,他發現無法重復論文中的運算。他的導師建議他聯系原作者,他最終收到了原始電子表格,發現了許多基本的計算誤差,包括錯誤的平均值,這在很大程度上破壞了研究結果。萊因哈特和羅格夫為他們的錯誤公開道歉,但他們的總體結論仍然得到了部分支持,而凱恩斯主義的經濟學家則抨擊他們是錯誤的決策者。美國經濟和政策研究中心批評了這項研究的結果,以及它為在美國和歐洲引起廣泛不滿的緊縮政策所提供的辯護。該研究中心反問道:“萊因哈特和羅格夫的算術錯誤造成了多少失業?”倫敦大學經濟學教授丹尼爾·哈默梅什(Daniel Hamermesh)懷疑,由于這項研究在政策上的應用,可能直接導致了失業現象:“但它為那些影響了人們如何看待這個世界的事物提供了一種知識上的合理化。而人們,特別是政治家,他們看待這個世界的方式會最終影響到世界的運行”。
兩位知名學者怎么會犯這樣的低級錯誤,還在如此長的時間里僥幸沒被發現呢?他們怎么發表在美國國家經濟研究局(NBER)的工作論文中呢?要知道,NBER可是世界上最負盛名的經濟智庫,因包括了22名諾貝爾獎獲得者而引以為傲,但卻沒有人注意到論文中錯誤的平均值計算。美國國內外的報紙,以及像國際貨幣基金組織這樣,在兩位經濟學家加入學術界之前曾經工作過的機構,都褒揚了兩人的成果。為什么沒有人發現這樣嚴重的計算錯誤呢?當然,這個事件也嚴肅地質疑了所謂的同行評審過程的可信度,我們不禁懷疑,還有多少影響著日常政策的研究中,也存在著類似的“偏愛”。
這樣的問題不僅僅在美國發生。在歐洲,社會心理學家迪德里克·斯塔佩爾(Diederik Stapel)是很多被廣泛引用的論文的作者,他的論文經常發表于像《科學》這樣的著名刊物上。他在2012年承認自己曾“修改了研究數據,偽造了某些科研項目的結果”,“不止是一次,而是好幾次”,“不僅是在一小段時間內,而是持續了很多年”。可以說,他的整個研究生涯,那些曾在社會定性研究領域給教育計劃和政策帶來很大影響的研究,都是以杜撰的數據為基礎的。在斯塔佩爾的一本回憶錄《出軌》中,他用強大的敘事力描述了他篡改數據的過程:
我更愿意在家中做這些,在深夜,所有人都睡去的時候。我會給自己泡一壺茶,將電腦放在桌上,從包里拿出便箋,用鋼筆寫下我將要完成的一整套研究項目和成果……后來,我開始輸入我臆想的數據,一行一行、一列一列……3、4、6、7、8、4、5、3、5、6、7、8、5、4、3、3、2。輸完數據后,我就可以開始做第一項分析。這些數據通常不會立即產生正確的結果,于是我便會返回模型并修改數據。4、6、7、5、4、7、8、2、4、4、6、5、6、7、8、5、4。直到所有分析結果都能按照預期實現為止。
斯塔佩爾坦誠地向所在大學的調查委員會承認了這一切:“我沒有經受住想獲得成功、想發表論文、想成為更厲害的學者的誘惑……在一個很少有制約平衡、人們總是單獨工作的制度下,我走錯了路。”
- PyTorch深度學習實戰:從新手小白到數據科學家
- Greenplum:從大數據戰略到實現
- 輕松學大數據挖掘:算法、場景與數據產品
- Visual Studio 2015 Cookbook(Second Edition)
- SQL Server 2008數據庫應用技術(第二版)
- MySQL從入門到精通(第3版)
- 業務數據分析:五招破解業務難題
- 商業分析思維與實踐:用數據分析解決商業問題
- 深入淺出MySQL:數據庫開發、優化與管理維護(第2版)
- “互聯網+”時代立體化計算機組
- PostgreSQL指南:內幕探索
- Solaris操作系統原理實驗教程
- SQL Server 2012實施與管理實戰指南
- Gideros Mobile Game Development
- 數據庫查詢優化器的藝術:原理解析與SQL性能優化