- 因果推斷:基于圖模型分析
- 羅銳編著
- 1779字
- 2023-08-28 19:18:55
1.4 本書主要內容及安排
本書以圖模型分析為主要工具,對變量之間的因果關系分析場景進行數學形式的描述,進而表達、解釋和推斷因果關系。后續各章內容之間的關系如下。
因果推斷主要基于概率圖模型的相關數學基礎知識,因此,我們在第2章對因果推斷所涉及的相關數學基礎知識進行簡要介紹。在概率論方面,包括隨機變量的概率及其數字特征、概率的計算公式、隨機變量的獨立性概念及判斷、貝葉斯公式及其應用,以及一元和多元線性回歸;在圖模型方面,介紹表達變量之間因果關系的兩種方式——結構因果模型和圖模型,圖模型的馬爾可夫性以及具有馬爾可夫性的圖模型中各個節點變量聯合概率分布的因子分解。
變量之間的獨立性或條件獨立性關系,通常是根據定義,通過概率分布的量化計算及相關等式是否成立來判斷。當變量之間的因果關系可以通過圖模型來表達時,如何在不掌握變量的概率分布或結構因果模型這樣的量化信息的條件下,僅僅通過反映變量間因果關系的圖模型結構,來分析、判斷節點變量之間的獨立性或條件獨立性關系呢?在第2章用圖模型表達變量之間因果關系的基礎上,第3章介紹基于圖模型分析來實現變量之間邊緣獨立性、條件獨立性的判斷。在此基礎上,引入d-劃分的概念,并提出基于圖模型分析的d-劃分判斷方法。
第4章是因果推斷的重點內容,我們將采用前面介紹的圖模型分析技術,對干預的因果效應進行分析,特別是在不實際執行干預的情況下,如何通過觀察性數據對干預下的因果效應進行計算。我們首先介紹最簡單的情況,以干預變量的父節點變量集合為調整變量,通過計算調整表達式對因果效應進行計算。在此基礎上,我們將調整表達式的計算方法推廣到更一般的情況——通過后門調整和前門調整對因果效應進行計算,并對線性系統中的因果推斷進行重點介紹。最后對利用工具變量法計算因果效應進行簡單介紹。
在第5章,我們通過反事實概念及數學表達式的引入,對與實際發生情況不同的虛擬假設情況下的相關概率進行表達、計算。第5章引入反事實分析的一系列概念和方法,包括反事實的概念、反事實分析的基本法則、基于結構因果模型的反事實量化計算、基于圖模型的反事實分析后門準則。在此基礎上,提出自然直接效應和自然間接效應的定義及其相關計算方法。最后,通過案例介紹反事實分析在醫學、法學和社會學方面的應用。
在反事實分析的基礎上,第6章對醫學、法學和人工智能等領域關注的因果關系概率——必要性概率、充分性概率和充分必要性概率進行定義,在一些特定的簡化、假設條件下,對這些因果關系概率進行量化計算,并以案例形式對這些因果關系概率在法學、醫學和社會學方面的應用進行簡單介紹。
第4章對一些簡單的因果效應分析場景進行了介紹,這些因果效應一般可以通過后門調整或前門調整表達式完成計算。作為進階內容,在第7章,我們對三種更為復雜的分析場景中因果效應的計算進行介紹,包括:非理想依從條件下因果效應的計算、已干預條件下因果效應(ETT)的計算,以及復雜圖模型條件下因果效應的計算。
第8章基于觀察性樣本數據集,對反映變量之間因果關系的圖模型結構進行學習,這一章以最簡單的基于約束的IC算法為例,對一步步推導得到節點變量之間圖模型結構的算法過程進行介紹。
最后,第9章對因果推斷的應用進行簡單介紹。由于前面各章內容中以案例的形式分別介紹了因果推斷在醫學、法學、經濟學和社會學方面的應用,這一章以兩節篇幅,分別介紹因果推斷在推薦系統A/B測試和強化學習中的應用。
在全書內容安排上,第2~5章是因果推斷的基本內容,第6~9章屬于進階內容。由于因果推斷在醫學、法學、經濟學、社會學和人工智能領域的廣泛應用,相關領域的讀者可以根據實際需要對本書進行選擇性閱讀。為了盡量完整地為讀者呈現因果推斷的相關概念及方法,本書也對因果推斷相關方法、理論的數學推導進行了介紹。對于重點關注因果推斷應用的讀者,可以略過這部分數學推導,重點關注結論及其應用。
為方便讀者將因果推斷知識盡快應用到實際工作中,本書在系統介紹因果推斷相關概念、方法的同時,盡量結合代碼對因果推斷的程序實現進行介紹。由于相關軟件較多、發展速度較快,本書在內容安排上以概念和方法的介紹為主、相關代碼實現為輔,以簡單的R語言程序為例,對一些因果推斷的基本概念及方法的程序實現進行了介紹,其他如Python等語言的程序實現,以及其他因果推斷相關功能的程序實現,有興趣的讀者可以進一步參考相關研究資料。