官术网_书友最值得收藏!

前言

近年來,人工智能技術取得了長足的進步,DeepMind公司的AlphaGo橫掃世界圍棋頂尖高手,AlphaFold能夠精確地基于氨基酸序列來預測蛋白質結構,其準確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或X單晶衍射等方法解析蛋白質結構的準確性相媲美。人工智能技術在許多領域取得了不可思議的進步,語音翻譯、圖像場景識別等曾是科幻小說中夢想的成就,現在已經成為現實。在技術突破和市場需求的多方驅動下,人工智能技術已經從學術走向實踐,正加速向各個產業滲透,改造各行各業。如同蒸汽時代的蒸汽機、電氣時代的發電機、信息時代的計算機和互聯網,人工智能正成為推動人類進入智能時代的決定性力量。

但是,現有的人工智能技術幾乎都是基于統計學或黑箱的形式,主要關注變量之間的相關性而非因果性,這使其性能有嚴重的理論局限性。它在動物擅長的一些技能方面表現并不好,特別是將解決問題的能力遷移至新問題,以及進行任意形式的泛化時。一些常識問題對于人類而言很簡單,但對于現在的人工智能技術而言并不簡單。因此,2011年圖靈獎得主、貝葉斯網絡之父朱迪亞·珀爾(Judea Pearl)教授認為,現在人工智能技術的發展進入了新的瓶頸期,“所有令人印象深刻的深度學習成果加起來不過是曲線擬合罷了”(All the impressive achievements of deep learning amount to just curve fitting),而且“深度學習技術是一種非常通用和強大的曲線擬合技術,它可以識別以前隱藏的模式,推斷出趨勢,并預測出各種問題的結果,但它僅僅停留在相關性這個層次上,也就是曲線擬合,而曲線擬合方法在表示給定數據集方面的一個風險是過度擬合,即算法不能識別出數據中的正常波動,最終會被干擾所迷惑”。珀爾認為,除非算法及其控制的機器能夠推理因果關系,或者至少概念化差異,否則算法的效用和通用性永遠不會接近于人類。麻省理工學院(MIT)的研究人員發表的一篇論文也指出,要創建類人的學習和思考的機器,需要它們能夠構建出世界的因果模型,能夠理解和解釋它們的環境,而不僅僅是使用模式識別來解決問題。因此,現有的人工智能技術需要超越現在的相關性關系層次,深入探究因果關系,最終制造出像人一樣思考的機器。

因果關系一直是人類認識世界的基本方式,也是現代科學的兩大基石之一。自古以來,關于因果關系的研究一直吸引著人們。通過系統性觀察和試驗發現自然規律、探索現象之間的因果關系,一直是各種科學研究的最終目標。愛因斯坦就認為西方科學是建立在以因果律為基礎的形式邏輯之上的。

相關性關系與因果關系之間的關系由萊辛巴赫(Reichenbach)形式化為著名的共同原因原理,即如果兩個隨機變量XY在統計學上具有相關性,那么其相互關系必為以下關系之一:

X導致Y

Y導致X

● 存在一個隨機變量Z,它是引起XY的共同原因。

因此,與相關性關系相比,因果關系具有更多的信息量,體現了變量之間更本質的關系。因果推斷的中心任務就是研究變量之間的因果關系:

● 分析如果某些變量被干預會發生什么;

● 分析影響干預及其結果的混雜因素;

● 分析以前從未觀察到的情況的結果。

因果關系與相關性關系不同,相關性關系指的是,如果我們觀測到了一個變量X的分布,就能推斷出另一個變量Y的分布,那么說明XY是有相關性的。而因果性則強調,如果我們干預了某個變量X,且這種干預引起了變量Y的變化,那么我們才能說明XY的因(cause),而YX的果(effect)——這是因果關系的基本出發點。基于因果關系的分析方法,我們可以避免得出“制止公雞打鳴就可以阻擋日出”這樣荒謬的結論。因此,基于因果關系的預測方法比基于相關性關系的預測方法更具有普適性。我們在人工智能研究中需要尋找這樣的因果關系,而不僅僅是簡單的相關性關系。

除人工智能研究領域之外,因果推斷在經濟學、社會學、醫學和法學等領域也有廣泛的應用。比如,在廣告界有一句廣為流傳的話:“我知道我的廣告費有一半被浪費了,但遺憾的是,我不知道是哪一半被浪費了。”這實際上是一個衡量廣告效果的問題。因為無法很精確地衡量廣告的效果,所以沒辦法進行進一步的廣告投放優化,只能白白浪費廣告費。從因果推斷的角度來看,如果我們把投放廣告看作一種“干預”(intervention),這個問題其實就是廣告投放的因果效應分析問題,需要我們通過因果推斷的方法進行分析。

從數據中分析、挖掘相關性關系的研究發展迅速,相關學習資料也很多,但因果推斷方面的學習資料還相對較少。國外有少量關于因果推斷的書籍。Judea Pearl教授在因果推斷方面有三本著作:The Book of Why: The New Science of Cause and EffectCausal Inference in Statistics: A PrimerCausality: Models,Reasoning,and Inference。耶魯大學Scott Cunningham教授編寫的Causal Inference:The Mixtape 2021年剛出版。哈佛大學流行病學家James Robins和他的同事也在寫一本關于因果推斷的書,目前提供了網絡版。這些書籍從不同角度對因果推斷進行了介紹,并且對因果推斷各個方面的問題都有比較精辟的論述,但對于因果推斷的初學者而言,這些材料相對較難。因此,我希望能為對因果推斷感興趣的讀者,包括人工智能、醫學、法學、經濟學和社會學等領域需要應用因果推斷進行研究或開發的科研人員和學生,提供一本關于因果推斷的入門書籍。

筆者在寫作過程中參考了因果推斷相關領域的大量論文和專著。關于因果推斷分析的研究思路,目前主要有Donald Rubin提出的潛在結果分析框架和Judea Pearl提出的圖模型分析框架。Judea Pearl對這兩套分析框架的等價性進行了分析。對于因果推斷的初學者,筆者認為圖模型分析框架更加直觀、易懂,因此,本書在因果推斷的內容和編排上主要參考了Judea Pearl教授在因果推斷方面的著作Causal Inference in Statistics: A PrimerCausality: Models, Reasoning, and Inference,以及Judea Pearl教授團隊在各種學術期刊和國際會議上發表的論文,在此對Judea Pearl教授及其團隊致以由衷的敬意。

為方便高等院校人工智能、數據挖掘、統計等相關專業將本書作為高年級本科生或研究生的教材使用,本書著重因果推斷基本概念、基本方法的介紹,并且在介紹基本概念、基本方法的同時,盡量給出必要的推導、證明和說明。同時,為了便于理解,也針對主要的基本概念、基本方法提供了相關的案例及分析,以便讀者通過案例分析加深對基本概念、基本方法的理解、掌握,并將相關方法應用到工作實際中。由于近年來因果推斷研究進展較快,因此很多重要、前沿的內容本書還未能覆蓋,讀者可參考最新文獻做進一步研究、探索。

本書第1章對因果推斷研究的背景進行了介紹;第2章和第3章對因果推斷分析所需要的基礎數學知識——概率論和圖模型相關知識進行了介紹;第4章對因果推斷中的干預分析進行了介紹;第5章介紹了因果推斷中的反事實分析及其應用;第6章介紹干預分析和反事實分析在因果關系概率計算上的應用;第7章是對干預分析、反事實分析進階內容的介紹;第8章對基于觀察性樣本數據集學習變量之間的圖模型結構進行了介紹;最后,第9章以推薦系統和強化學習為例,介紹了因果推斷在人工智能方面的一些初步應用。

本書在寫作過程中得到了Judea Pearl教授的幫助,在此表示衷心的感謝。

筆者還要感謝四川省科技計劃資助項目(立項編號:2021YFG0169)的支持。雖然本書主要介紹了前人在因果推斷方面的研究成果,但該項目與因果推斷相關,可以將本書看作該項目的前期調研和積累,筆者個人更多的研究成果留待今后再與大家分享。同時,也要感謝機械工業出版社姚蕾老師和郎亞妹老師在本書寫作和出版過程中給予的諸多指導和幫助。

隨著人工智能技術的快速發展,近年來因果推斷的分析、研究也取得了長足的進步,由于本人水平有限,書中難免存在錯誤和不妥之處,敬請各位讀者給予批評和指正。

最后,我要特別感謝我的家人,是他們的愛和關懷讓我克服困難完成了本書的寫作。

羅 銳

2022年1月于成都

主站蜘蛛池模板: 靖安县| 宝丰县| 油尖旺区| 邓州市| 体育| 宿松县| 富平县| 新营市| 临安市| 修武县| 犍为县| 南昌县| 南江县| 化州市| 上蔡县| 富民县| 陇川县| 邯郸县| 洪江市| 南投市| 子洲县| 祥云县| 韩城市| 平武县| 安泽县| 乃东县| 舞钢市| 乌兰浩特市| 阳城县| 同江市| 米林县| 新巴尔虎右旗| 绥江县| 张家川| 贺州市| 江山市| 屯昌县| 太康县| 芷江| 南平市| 左云县|