官术网_书友最值得收藏!

  • 概率思維預測未來
  • (美)威廉·龐德斯通
  • 4134字
  • 2022-03-10 18:02:51

譯者序

預測是一朵帶刺的玫瑰

從幾千年前的巫祝(1)開始,人類就開始預測未來。只不過那個時候的預測,往往是基于極其樸素的世界運行原理:例如以“水為萬物生長和運動之源”為核心的泰勒斯假說和以“對立、協同、轉換”為核心的陰陽學說;又或者一些重大事件之間的偶發聯系,例如某一次日食后出現了持續數月的大旱。至于本書的重頭戲——關于末日的預測,在宗教與科學“相愛相殺”的人類歷史演進中,從來就沒有缺席過。然而,以現代科學的標準看,除了少量極其罕見的嚴肅討論外(本書將介紹幾乎所有有價值的討論),這類“預測”不過是人類的卑微理性在無常的自然和縹緲的未來面前無畏的掙扎罷了。

基于預測所使用的理論和方法的堅實程度以及相應的對于預測結果正確性的信念,我們可以大致把預測分為三類。一個極端是基于嚴格理論的預測結果,例如基于量子力學理論,預測某粒子在某時間段內出現在某區域內的概率。這種預測可以用來檢驗相應的物理理論是否正確。另一個極端是對未來的定性預言,這些預言往往來自未來學家和科幻作家,例如法國小說家儒勒·凡爾納(Jules Verne)在《從地球到月球》中對人類登月和在《海底兩萬里》中對海底潛艇的預言,世界著名未來學家阿爾文·托夫勒(Alvin Toffler)在《第三次浪潮》中對互聯網科技時代的預言,以及法國預言家諾查丹瑪斯(Nostradamus)在《諸世紀》中對世界末日的預言,等等。這類預言更像是猜測而非預測,往往只能給出定性的判斷,而不能給出定量的精確度。有時,預言模糊到可以有不同的解釋方法,以至于連定性的判斷都做不到,例如我們對李淳風和袁天罡所著的《推背圖》的解讀(2)。而我所感興趣的預測,是介于兩種極端之間的第三類:既沒有一套堅實的理論作為支撐,也不是漫無邊際的未來學說,而是基于手頭已經掌握的一些數據,利用概率統計、數據挖掘或者機器學習的方法,對未知的數據或者未來的發展進行的可量化的預測。

對于自然科學和努力向自然科學靠近的社會科學來說,“解釋—預測—干預”(或稱“解釋—預測—控制”)是我們回答科學問題的三部曲,其任務分別是:(1)提出理論模型,解釋已經觀察到的現象;(2)預測未被觀察到的數據或現象(可能是缺失的數據,也可能是未來才會發生的事件);(3)通過對真實系統進行具體的干預以達到提前預設的目標。針對一個現象“看起來正確”的解釋,并不能說明相應的理論或機制就是正確的,而僅僅是指出了一種正確的可能性。事實上,這種解釋的可信度往往都是比較低的。

很多社會科學研究都是典型的“事后諸葛亮”,當一個事件發生之后,總能提出一些經過修修補補的理論模型,對已經發生的事件給出定性正確甚至定量精確的解釋。自然科學亦是如此,通過添加越來越多的本輪和均輪(3),打了補丁的托勒密的地心說“茍延殘喘”了1500多年。經濟學界有一句諺語,大意是“能預測經濟危機的理論一個也沒有,能解釋經濟危機的理論卻俯拾皆是”,從這個意義上來講,預測一般要難于解釋,正確預測對于理論正確性的背書力度也要強于解釋。當然,這里的更難主要是指預測尚未發生的事,而不是缺失的數據,預測后者通常要更容易一些。正確的預測也可能翻車,比如地心說也可以成功預測很多天象,只是隨著測量精度的提升以及對預測精度要求的相應提高,錯誤的理論終究會破綻百出。與解釋和預測相比,成功的干預可以極大地增強我們對理論正確性和適用性的信心,因為在不知道或者弄錯了因果關系的前提下,恰好出現我們期望的干預結果的可能性是很小的。

盡管對于理論正確性的背書力度是干預超過預測、預測超過解釋,但我認為預測在科學研究,特別是社會科學研究中處于最重要的位置,因為社會科學的研究對象具有極大的不完備性和不確定性。影響社會發展的因素數不勝數,任何理論都不可能將它們全盤納入,而單個因素也是不獨立且不穩定的,會受外部環境和其他因素的影響。因此,在一個封閉的環境中,通過設計可控的重復實驗,觀察干預的結果,從而對社會理論進行定量驗證,是不太可能實現或者成本極高,而這恰恰是物理科學和其他自然科學得以螺旋式前進的基本方法1。在這個前提下,預測尚未觀察或尚未發生的數據或事件,就成了檢驗理論正確性最有效的手段。

另外,從更廣泛的意義上講,干預中必然包含預測,因為我們需要提前預測干預的結果,并且和真實的實驗結果做對比。由于干預工作的絕大部分工作量往往都集中在實驗設計和實施,所以我們往往忘記干預之前總是需要做預測的。一種可能的做法是,在干預實驗之前沒有理論和預測,而需要根據干預實驗的結果“重新發現”合適的理論,這種因果倒置的研究方法是極度危險的,因為理論模型會根據干預實驗的結果進行各種調整,從而變成一個過擬合(4)的理論。以上林林總總,導致了社會科學領域的理論模型和實驗結果高度不可信2。只有當一套理論解釋還能夠持續地、高精度地對尚未發生的事件進行預測時,我們才能真正信服3-4

得益于可獲取數據量的暴漲和計算能力的飛升,預測在現代社會學、經濟學、管理學乃至政治學中似乎已經開始并即將扮演統治性的重要地位5-6!這些預測涉及我們可以想到和難以想到的方方面面:從一個人的民族、信仰、政治態度、性別取向7,到一個人是否罹患抑郁癥8;從社交網絡未來的演化9,到生物網絡中未知的鏈接10;從恐怖襲擊最可能發生的時間和空間11,到各個國家和地區政治大選的最終結果12……在本書中,各位讀者還可以看到更多更奇妙的“可供預測的對象”,而在閱讀這本書之前,大家恐怕都不會想到這些對象也可以用科學的方式進行預測。

然而,預測絕不僅僅是一朵盛開的玫瑰,而是一朵帶刺的玫瑰。即便排除因為實驗人員有意識或者無意識驅動預測結果向有利于理論的方向滑動而帶來的問題、錯誤地使用數據和方法,以及錯誤地理解和應用預測的結果,都有可能帶來災難性的后果13-14。下面我選擇三個較為重要的批判性論題,供各位讀者討論。

第一,預測中存在自證陷阱和自否偏差。預測都是在某種前提或環境下做出來的,而預測本身有可能改變這種環境。所以,我們看到的正確或者錯誤,有可能都是預測本身帶來的,而和預測結果沒有關系15。首先,很多預測具有自證的特性。例如,基金委員會召集資深專家或者利用機器學習的方法,試圖預測未來學者能夠在哪些研究方向中做出顛覆性或系統性的貢獻。這就是一個典型的自證場景。因為無論是專家意見、機器學習還是隨機亂說,只要基金委員會處在正常的邏輯下,必然會大幅提高對這些“重要方向”的支持力度,那么學者更可能在這些方向做出更多貢獻,而這又反過來證明了預測的正確性。其次,很多預測具有自否的特性。比如,我們通過對治安事件時空模式的分析,預測出了接下來一段時間最容易出現街頭犯罪的場所,于是公安部門在相應的時間和地點增加了巡邏的警力,結果街頭犯罪量大幅降低。請問,這個預測本身是正確的還是錯誤的呢?又比如我們自動監測慢性腎病患者的用藥和飲食習慣,發現有一個患者經常不按時按量服藥并且不忌口,根據大量病歷樣本,我們預測他2年之后會轉為尿毒癥。患者震驚于這個警告,然后改變了自己的習慣,盡最大可能配合醫囑,結果5年過去了,病情也沒有進一步發展。請問,這個預測本身是正確的還是錯誤的呢?

第二,數據偏差會降低預測結果的適用度。如果用于預測的數據不能很好地表示該理論或模型所應用或針對的目標群體,就會出現數據的表示偏差,這是最常見的數據偏差之一。例如,想通過分析微博的語言來看整個中國民眾的情緒狀況和幸福水平,就可能會出現表示偏差,因為微博用戶全體或隨機抽樣會對年輕人“表示過度”而對老年人“表示不足”。因此,從微博數據中得到的中國民眾幸福水平,以及通過進一步文本分析獲取的中國民眾訴求,可能無法準確反映老年人的情況。也就是說,用被某來源數據訓練出來的模型,有可能對于該來源中表示不足的群體并不適用或者效果較差。如果把模型和結論用到其他來源的數據集中,則需要更加小心,因為一般而言都會存在表示偏差。例如ImageNet(5)中來自中國和印度的照片只占1%和2%,因此直接用ImageNet訓練出來的分類器在分類物品和人的時候,如果這個圖片來自中國或印度,其精確度就顯著低于平均水平16

第三,預測可能會加劇偏見和歧視。即便數據本身是真實的,如果數據中存在大量的負面內容,基于這些數據的預測結果就可能學會甚至放大與這些負面內容相關的偏見。例如,基于谷歌新聞、維基百科等超大規模歷史語料庫數據的預訓練模型(該模型的結果已經被廣泛應用于自然語言處理的各種分析和預測工作中)所得到的單詞的向量表示中,已經沉淀了嚴重的性別和倫理方面的刻板印象,比如詞語“護士”和女性高度相關,詞語“工程師”和男性高度相關,詞語“同性戀”與疾病、恥辱高度相關17。我們現在努力消除的一些偏見可能在歷史語料庫中很常見,如果不加分辨地應用,聰明的預測算法可能很快就學會了這些偏見。

哪怕直接應用真實的數據,也可能導致加劇歧視的結果。在職場中性別歧視非常嚴重,例如某互聯網求職簡歷數據顯示,在同等學歷條件和行業背景下,女性要多工作5~10年才能獲得和男性相當的薪水18。使用這類數據進行職位推薦(本質上是預測你適合什么樣的職位,然后把這個職位推薦給你),結果必然自帶歧視。例如,谷歌廣告系統的人工智能算法在推送職位招聘信息的時候,同等教育背景和工作經歷下的男性要比女性以高得多的頻率收到高收入職位的招聘信息19。如果我們有一組人力資源數據,數據中顯示,每十個前1%高年薪的高端職位中只有一位女性,于是“性別為女性”這個特征值在獲得高端職位匹配預測中將是一個負面的因素,算法的結果自然也將避免給女性推送高端職位信息。在沒有基于大數據預測和推薦服務的情況下,男性和女性獲得高端職位信息的數量可能相差不大,這種情況下女性真正獲聘高端職位的可能性也遠低于男性。如今,計算機的自動服務在源頭上就讓女性獲得信息的機會更少,所以可以預測,女性獲得高端職位的比例將進一步降低,而這又再次降低新數據中女性獲得高端職位的比例,從而讓算法更少向女性推薦高端職位。這種惡性循環,會進一步加劇原本就存在的性別歧視和不公。

我們正在進入一個“一切皆可預測”的時代,但諸位手頭的這本《概率思維預測未來》,本質上不是講預測的,而是講概率論的,因此,我的序言起到的是拋磚引玉的作用。我只是借著寫序的地方,表達一些關于預測有好有壞的看法。

主站蜘蛛池模板: 大荔县| 九龙城区| 兖州市| 九江市| 陆良县| 同心县| 新民市| 天门市| 灵武市| 繁峙县| 建德市| 天津市| 右玉县| 吉安县| 舞钢市| 栖霞市| 岳阳县| 永清县| 临湘市| 中阳县| 新乐市| 搜索| 马龙县| 新昌县| 偏关县| 增城市| 嘉善县| 大厂| 茂名市| 定州市| 丹巴县| 无锡市| 子洲县| 乳山市| 甘孜县| 田林县| 台中市| 嘉峪关市| 苏尼特左旗| 手机| 诸城市|