官术网_书友最值得收藏!

賈小雙.?社會科學中的因果分析——潛在結果模型、因果網絡模型與ABM[M/OL]//趙聯飛,趙鋒.社會研究方法評論:第1卷.重慶:重慶大學電子音像出版社.

社會科學中的因果分析

——潛在結果模型、因果網絡模型與ABM

賈小雙[1]

摘要因果問題是社會科學的核心問題在因果研究中采取反事實的因果定義已在各學科中達成共識在這一前提下當前社會科學的因果分析主要在三大方法論框架下展開潛在結果模型因果網絡模型和ABM。本文對這三大方法論框架的核心思想及其主要模型和方法進行了回顧首先按照數據類型和混淆變量的可觀測性對傾向值匹配加權、工具變量斷點回歸雙重差分法等傳統的模型進行了梳理并介紹了與機器學習結合的最新進展接著對因果網絡模型的來源和其主要方法——貝葉斯因果圖——進行了介紹并簡單闡述了貝葉斯因果圖對于揭示橫向因果機制的作用最后對ABM的模型原理進行了介紹分析了其在識別因果關系上的限制及其用于分析縱向因果機制的前提條件優勢與局限本文希望通過系統性的梳理來為社會科學研究者了解因果分析方法體系及其前沿進展提供參考

關鍵詞:因果推理;反事實;潛在結果模型;因果網絡模型;ABM

Abstract:?Causality?is?a?core?issue?in?social?sciences?research.?The?counterfactual?definition?of?causality?has?reached?a?consensus?in?different?research?fields.?Therefore,?current?causal?studies?of?social?sciences?are?mostly?carried?out?under?three?frameworks:?the?Potential?Outcomes?Models,?Structural?Causal?Models?(SCM),?and?Agent-based?Modeling?(ABM).?This?paper?reviewed?the?core?concepts?of?these?three?methodological?frameworks?and?their?main?models?and?methods.?We?started?from?reviewing?the?classical?statistical?models?under?the?potential?outcome?framework?such?as?PSM,?IPTW,?IV,?RDD,?DID,?etc.,?we?classified?them?by?the?type?of?data?and?the?observability?of?the?confounders?and?then?introduced?their?up?to?date?progress?in?machine?learning.?Then?we?turned?to?the?SCM,?after?a?brief?introduction?of?is?history,?we?reviewed?the?Casual?Bayesian?Network,?which?is?one?of?the?most?important?models?under?this?framework.?Further,?we?introduced?ABM?and?assessed?its?limitations?when?doing?causal?inference?and?its?pre-conditions,strengths?and?weaknesses?when?revealing?vertical?causal?mechanism.?By?systematically?reviewing?the?three?framework?above,?we?hope?to?provide?a?clear?clue?for?social?scientists?and?help?them?to?keep?up?with?the?state?of?the?art?methods?of?causal?inference?by?this.

Keywords:?causal?inference;?counterfactual?framework;potential?outcome?models,?Structural?Causal?Models,?Agent-based?Modeling

一、引言

尋求事物之間的因果關系是各學科研究的終極目標,而且各學科對因果的定義和因果分析方法已有大量的理論與科學方法論的探討。隨著因果推理方法的發展,研究者越來越強調相關關系和因果關系的差別,并致力于探討如何在更嚴格的因果定義下進行因果推理(王天夫,2006;彭玉生,2011;孟天廣,2017;Abbott,1998;Doreian,1999;Goldthorpe,2001;Winship?&?Sobel,2004)。統計學家、圖靈獎得主Pearl針對大數據時代人工智能的發展現狀提出因果關系的三級階梯:相關(association)、干預(intervention)和反事實(conterfactuals)。這一組概念很好地闡釋了相關關系與因果關系的區別。Pearl指出,當前的大數據分析和人工智能的因果推理大多數停留在相關性的層面,處于因果之梯的最底端,因為研究者僅僅基于概率上的聯合分布來回答“是什么”(what?is)的問題(例如:如果觀察到某種癥狀,則有多大可能是因為患了某種疾病);而干預性研究則更進一步,可以通過干預來回答“如果采取某種策略將會怎么樣”(what?if)的問題(例如:如果吃了藥,病情將會發生什么樣的改變);但相關性和干預性研究都不能對因果關系作出推斷,而只有在二者的基礎上更進一步,能夠回答“如果采取相反的策略,結果會有什么不同(what?if?I?had?acted?differently)”的反事實的問題時,才能推斷該策略是否是這一結果的原因(Pearl,2018)。以上這種因果推理的嚴格定義被稱為因果推理的?“反事實框架”(conterfactul?framework)[2]。目前,在反事實框架下進行因果推理已成為各學科研究者的普遍共識。

統計學領域的因果推斷主要采用兩類模型:潛在結果模型(potential?outcome?model)和因果網絡模型(causal?graph)。前者通過給出反事實框架下因果效應的數學定義,并通過統計模型量化估計原因對結果的因果效應;而后者是在貝葉斯網絡上進行外部干預,既能估計因果效應,也能通過確定多個變量之間的因果關系來反映因果作用機制(苗旺等,2018;Morgan?&?Winship,2014,2015)。社會科學研究者普遍使用潛在結果模型來進行因果推斷,而很少使用因果網絡模型。社會科學研究中常見的用于分析截面數據的傾向值匹配(propensity?score?matching?,PSM)、逆概加權估計(inverse?probability?weighted?estimation,?IPWE)、工具變量(instrumental?variable,IV)、斷點回歸(regression?discontinuity?design,RDD)等方法,用于分析面板數據的雙重差分difference-in-difference,DID)等方法以及隨機實驗研究,從方法上來看都屬于統計學中潛在結果模型的范疇。

近年來,隨著計算社會科學的發展,其兩大研究范式——社會模擬(social?simulation)和大數據分析——也為社會科學的中的因果問題研究提供了新思路。一方面,計算機模擬技術在社會科學中的普及使得學者對因果機制的研究在方法上取得新的突破:基于自主行動者建模(Agent-based?Modeling,ABM)的方法逐漸被運用于模擬社會互動與社會現象產生的過程,成為研究社會現象產生的因果機制的重要方法(Epstein,1999,2006;Bianchi?&?Squazzoni,2015;Bruch?&?Atwell,?2015;Hedstr?m,2005;Hedstr?m?&?Ylikoski?2010;Hedstr?m?et?al.,2009);另一方面,機器學習等大數據分析技術的發展也使得傳統因果推斷的統計模型得到進一步豐富和改善(李文釗;2018;Athey?&?Imbens,2017;Athey?et?al.,2018)。同時,機器學習領域對圖模型(graphical?model)的廣泛運用也使長期被社會科學家忽略的因果網絡模型得以進入社會科學研究者的視野(Morgan?&?Winship,2014,2015)。

本文嘗試對上述社會科學中因果分析的三大方法論體系——潛在結果模型、因果網絡模型和ABM——進行系統梳理,希望能夠通過回顧其代表性的方法及應用為社會科學研究者選取適當的方法進行因果推斷和因果機制分析提供一些參考。

二、潛在結果模型

(一)因果推斷的反事實框架與潛在結果模型

社會科學的因果推斷需要采用反事實的框架在定量研究中展開。最早使用“反事實”的術語來定義因果關系的是哲學家休謨(Hume,1748)。哲學家密爾的因果推論邏輯中的差異法也暗含反事實的思想(Mill,1843;Mackie,?1973,1980;Goodman,?1947;Lyon,?1967)。這些零碎的思想最終在劉易斯的著作中被整合,形成了哲學上的反事實因果關系理論(counterfactual?theories?of?Causation)(David?Lewis,1973,1986)。哲學上的反事實因果分析框架主要是對一般性的因果關系進行討論;在這一思想的基礎上,統計學和社會科學發展出了對特定因果關系進行推理的反事實框架(Neyman,?1923;Rubin,1974;?Fisher,1935,1971;Morgan?&?Winship,2014;?Winship?&?Morgan,1999)。

在社會科學的反事實框架中,?“事實”是指在采取某種特定的干預或處理(treatment)T的情況下觀測到的Y的狀態或結果;而“反事實”是指采取與T相反的干預或處理(通常是不處理)時Y的狀態或結果。反事實框架下因果作用的定義是:在其他因素保持不變的情況下,接受處理和未接受處理在結果上的被觀測到的凈差異(net?difference)在多大程度上可歸因于該處理(蔣建忠,2017),即處理效應(treatment?effect)。但由于人不能兩次踏入同一條河流,對于同一個個體,我們只能觀察到事實,而觀察不到反事實。例如,當我們研究上大學對于收入的效應時,我們只能觀察到上大學的人上了大學后的收入,而觀察不到假如這些人不上大學的收入。反事實無法觀測的問題使得我們難以對因果作用作出推斷。

統計學家Neyman(1990[1923],?1935)使用潛在結果(potential?outcome)的概念提出了實驗研究(experimental?studies)中反事實因果作用的形式化定義;Rubin(1974,?1977,?1978,?1980a,?1981,?1986,?1990)將這一定義推廣到觀察性研究中(observational?studies),形成了統計學中因果推斷的潛在結果框架[3](potential?outcome?framework,也常被稱為Neyman-Rubin?Causal?Model)。潛在結果模型解決了因果推斷中反事實無法觀測的問題,成為統計學、社會科學因果推斷最主要的方法,因此,社會科學中“因果推斷的反事實框架”通常將“潛在結果模型”稱為“因果推斷的反事實框架”(李文釗,2018)[4]

潛在結果模型的核心思想是,假設我們要研究某種干預Wi∈{0,1}的處理效應,W=1表示接受處理,W=0表示未接受處理,個體i在這兩種處理狀態下有兩個潛在的結果:接受處理后的結果Yi(1)和不接受處理的結果Yi(0),我們觀察到的結果Yiobs可以表示為Yiobs=Yi(Wi)=Wi·Yi(1)—(1—Wi)·Yi(0);?個體i的處理效應可以表示為Ti=Yi(1)?—Yi(0)。由于對于同一個人只能接受一種處理(Wi=1?或Wi=0),我們只能觀察到一種處理狀態下的結果,而反事實的結果我們是觀察不到的,是一個缺失值(missing?value),因此個體的處理效應是無法被直接計算的。而統計學和社會科學關注的是總體層面的特征和規律,我們可以利用潛在結果來定義總體平均處理效應T(average?treatment?effect,ATE):

T=E[Yi(1)—Yi(0)]=E[Yi(1)]—?E[Yi(0)]

潛在結果模型有一個重要假設——個體處理值穩定假設(Stable?Unit?Treatment?Value?Assumption,?SUTVA),SUTVA假設是指任意一個個體的潛在結果不隨其他個體是否接受處理而改變;并且無論干預分配機制如何,對每一個個體和每一種處理只有一個潛在結果[5]。也就是說,張三上大學后的收入與李四上不上大學沒有關系,且無論張三是怎么上了大學的,他接受“上大學”這個處理只會有一個收入值,反之亦然。這一假設為我們填補反事實的缺失值提供了可能:假設所有人的收入只受他上不上大學的影響而不考慮其他因素,那么所有上了大學的人的收入都相同,為Y(1),所有沒上大學的人的收入也相同,為Y(0);在這種情況下,Y(1)和Y(0)的取值恒定,不受是否接受處理(Wi取值)的影響,即滿足Yi⊥Wi;在這種情況下,根據SUTVA假設,我們便可以通過觀察到的Yj(0)來補充缺失的?Yi(1)(即用沒上大學的收入來填補上大學的人加入沒上大學的收入),從而得到個體i在上大學Wi=1和沒上大學Wi=0兩種情況下的潛在結果

然而在現實中,這一理想情況不可能得到滿足,因為除了是否上大學外,一個人的收入還與一系列其他因素X(如性別、政治面貌、社會網絡資源、個人能力、勤奮程度等等)有關,并且這些因素不僅影響觀測到的結果Yiobs(個體i的收入),也對處理的分配機制(個體i是否上大學)產生影響,被稱為混雜因素(confounders,也常被稱作混淆變量)。處理的分配機制(Assignment?Mechanism)是潛在結果模型的一個重要內容,分配機制直接決定哪些研究對象接受干預,哪些不接受干預(作為控制),也就直接決定了我們所觀察到的潛在結果;而SUTVA假設要求潛在結果不受處理分配機制的影響,因此,Rubin提出了潛在結果模型的另一個重要假設——干預分配機制可忽略性假設(Ignorable?Treatment?Assignment?Assumption),可忽略的干預分配機制也被稱為非混淆分配機制(Unconfounded?Assignment)(Rubin,1973)。由于分配機制受到混雜因素X的影響,因此我們需要混雜因素加以控制,使得接受處理和不接受處理的潛在結果不受是否接受處理的分配機制的影響,即Yi⊥Wi|?Xi,從而構造潛在結果框架來計算平均因果效應。

隨機實驗(random?experiment)是構造潛在結果框架的有效模式:在理想的隨機實驗中,我們把研究對象隨機地(例如使用拋硬幣的方式)分配到兩組中,其中實驗組(experiment?group)接受處理(W=1),而控制組(control?group)不接受處理(W=0),這樣就構成了一組潛在結果(Y(0),Y(1))。由于分組是完全隨機的,個體究竟被分在哪一組(或得到多大的實驗處理水平)與個體的特征和其他可能影響實驗的結果的因素是完全獨立的,這樣我們就可以把兩組的平均結果進行比較,其差異便是這種處理的處理效應(Fisher,1935;蔣建忠,2017;孟天廣,2017)。

由于社會科學研究很難進行隨機實驗[6],研究者通常使用調查數據、普查數據、行政管理檔案、互聯網上的記錄等觀察數據進行研究,而觀察數據不是通過隨機實驗得來,無法保證處理分配機制的隨機性,如果忽略影響處理分配機制的混雜因素直接進行因果推斷,對因果效應的估計就會產生偏差,即產生社會科學所說的“內生性”問題。統計學、社會科學的諸多學者對如何識別混雜因素以及如何解決混雜因素所帶來的內生性問題進行了討論,并通過對干預分配機制可忽略性假設成立的前提條件進行設定,發展出了豐富的基于非混淆機制假設的潛在結果模型,使得我們可以在觀察數據中進行因果推斷。下面我們將對常見的用于觀察研究的潛在結果模型進行介紹。

(二)觀察研究中的潛在結果模型

目前已有不少文獻對使用觀察數據進行因果推斷的潛在結果模型進行了綜述:Winship和Morgan(1999)按照是否包含多個不同時間(時期或時點)的觀測值將觀察數據分為截面數據(Cross-sectional?data)和縱向數據(Longitudinal?data),并分別介紹了針對截面數據的斷點回歸、傾向值分析、Heckman選擇模型(selection?models)、工具變量方法和針縱向數據的間斷時間序列設計(Interrupted?Time?Series?design)等潛在結果模型;陳云松、范曉光(2010)將內生性問題的來源總結為遺漏變量、自選擇、樣本選擇和聯立四種偏誤,并梳理了解決每一種偏誤的模型和方法;胡安寧(2012)對傾向值匹配、工具變量和斷點回歸這三種常見的因果推論的方法進行對比,突出了傾向值匹配方法的優勢;統計學家苗旺等人(2019)介紹了潛在結果模型判別混雜因素的兩類準則,并基于混雜因素的可觀測性與否分別總結了混雜因素可觀測與不可觀測兩種情況下的潛在結果模型(可觀測——傾向性匹配、逆概加權估計估計、雙穩健估計(doubly?robust?estimation)方法;不可觀測——工具變量方法和陰性對照變量法)。Athey和Imbens(2017)總結了計量經濟學中用于政策效果評估的潛在結果框架下的因果識別策略(identification?strateges),詳細介紹了斷點回歸、合成控制法、雙重差分法、Manski線性均值模型(linear-in-means?models)、實驗與觀察數據結合等方法,并討論了這些方法的輔助分析(Supplementary?analyses)策略以及這些方法的最新進展。

觀察數據中進行因果推斷的潛在結果模型有兩個任務:第一,基于處理變量將觀察數據中的樣本分為實驗組(treated?group)與對照組(untreated?group)來構造“準實驗”(quasi-experiment)場景,并對影響分配機制的混雜因素進行識別和控制,使得處理分配機制可忽略性假設得到滿足(即潛在結果不受處理分配機制的影響);第二,在此基礎上使用回歸模型來估計平均處理效應。通過回顧這些模型可以發現,不同模型之間的差異主要體現在模型如何控制混雜因素以保證干預分配機制的隨機性。接下來本文將從控制混雜因素的角度來對比分析常見的潛在結果模型的差異(由于這些方法已非常成熟,已有大量文獻對其原理及其應用進行了詳細且深入的討論,在此不再贅述,感興趣可查閱各模型的參考文獻)。

1.?傾向值匹配

如表1所示,社會科學中最常使用的傾向值匹配模型是通過對處理組和控制組的樣本進行匹配的方式來消除協變量對處理分配機制的影響。傾向值匹配模型的前提假設是所有影響處理分配機制的混淆變量可觀測,即認為個體i是否接受處理受到一組可觀測的變量X的影響,那么基于Xi可以估計出個體接受處理的概率,即傾向值(propensity?score)。傾向值匹配是對傾向值相近但實際接受處理不同的樣本進行匹配,使得協變量X在處理組和控制組中的分布達到平衡,從而消除混淆變量對處理分配機制的影響,然后再使用配對后的樣本來估計平均處理效應(Rosenbaum?&?Rubin,1983;胡安寧,2012;Morgan?&?Winship,2015,郭申陽,2012;Abadie?&?Imbens,2016)。

表1 對觀察數據做因果推斷的潛在結果模型

2.?其他匹配方法

傾向值匹配是匹配方法(Matching?method)的一種,匹配方法的本質是將在其他特征(混淆變量X)上相似的接受處理和未接受處理的樣本進行配對,把未接受處理樣本的觀測值作為接受處理樣本觀測值的反事實的潛在結果(Sizemore?&?Alkurdi,2019)。傾向值匹配是通過使用logistic回歸模型估計個體接受處理的概率來作為樣本相似性的度量方式,除此之外,也可以使用馬氏距離(Mahalanobis?Distance)來測量樣本的相似性。傾向值匹配和馬氏距離匹(Mahalanobis?Distance?Matching,MDM)都是通過降維的方法將多維協變量降成一維的相似性度量,二者的差別在于當協變量維度過高時,馬氏距離不如傾向性匹配的效果好(Rubin,?1973;1980;Rubin,?1979;Feng?et?al.,?2019;Leuven?&?Sianesi,?2003;)。除降維方式外,也可以使用精確匹配(Exact?Matching)的方法在協變量(必須是分類變量)構成的特征空間中一對一匹配;或者使用粗粒化的精確匹配(Coarsened?Exact?Matching)的方法對協變量的取值進行分層(將連續變量離散化),然后再進行匹配。(Iacus?et?al.,?2009;?Stuart,2010;Imbens;2015;Morgan?&?Winship,2015;對匹配方法的全面總結參見Sizemore?&?Alkurdi,2019)

3.?傾向值加權

傾向值除了用于匹配外,還可以用來對樣本進行加權從而平衡樣本在協變量上的分布。個體i的權重Mi為個體傾向值的倒數,計算公式為:Mi=+,其中Ps(Xi)為個體i的傾向值。逆概加權估計(Inverse?Probability?of?Treatment?Weighting,IPTW)和雙穩健估計(Doubly?Robust?Estimation)在根據傾向值對樣本加權后,使用回歸模型來估計平均處理效應(Czajka?et?al.,?1992;?Lunceford?&?Davidian,?2004;?Hirano?et?al.,?2003;Bang?&?Robins,2005;Kreif?&?DiazOrdaz,2019;苗旺,2018;Stuart,2010;Morgan?&?Winship,2015)。

4.?工具變量

上述匹配和加權的方法都建立在混淆變量可觀測的前提假設下,但這一假設在現實中往往無法滿足,現實中往往存在一些不可觀測的混淆變量對分配機制和潛在結果產生影響。例如影響一個人上大學常常受到智商和努力程度的影響,而人的收入也可能一定程度上受到智商和努力程度的影響。在這種情況下,匹配和加權模型對上大學對收入的凈效應的估計可能是有偏的。工具變量方法可以解決混淆變量U不可觀測情況下的因果推斷問題。工具變量方法的邏輯是構造一個關于Z→W→Y關系鏈條,其中Z是工具變量。工具變量需滿足僅與處理變量W相關,且與結果Y不直接相關,且與混淆變量U無關。也就是說工具變量不直接影響結果,Z對結果Y的影響只能通過處理狀態W來進行傳遞,此時如果我們可以驗證Z對Y的效應是顯著的,就能推斷出W對Y的局部平均處理效應(local?average?treatment?effect)(Angrist?et?al.,?1996;Angrist?&?Krueger,?2001;苗旺等,2018)。但工具變量存在一系列前提假設,研究者很難找到一個適當的工具變量,導致工具變量方法在研究中的使用存在很大的限制(陳云松,2013;胡安寧,2012;李超、求文星,2021)。

5.?斷點回歸

除工具變量外,斷點回歸(Regression?Discontinuity?Design,RDD,也被稱為回歸中斷設計)也可以在含有不可觀測的混雜因素的情況下進行因果推斷。斷點回歸的關鍵在于尋找一個參考變量C,這個參考變量的某一個值C=c可以作為決定個體是否接受處理的臨界值。若個體的參考變量大于臨界值(Ci?>?c)則進入處理組(W=1),反之則進入控制組(當Ci?<?c時W=0),即根據C=c的“一刀切”的方式認為造成了一個“中斷”(Discontinuity)。而接近斷點C=c附近的個體的其他特征是非常相似的,因此這種劃分方式使處理組和控制組的分配十分接近隨機實驗。如果結果Y也在斷點處形成中斷,我們可以通過處理組與控制組的Y值的差異來估計W對于Y的凈效應。斷點回歸可以分為兩類:第一類是精確斷點,其臨界值是確定的(Sharp),在臨界值一側的所有的個體都接受了處理,反之,在臨界值另一側的所有個體都沒有接受處理。此時,接受處理的概率只有0和1兩個取值。第二類是模糊斷點,其臨界點是模糊的(Fussy),在臨界值附近接受處置的概率是單調變化的而非只有0、1兩種取值。在一定的假設下無論是哪一類型的斷點回歸,都可以利用臨界值附近樣本的系統性變化來研究處置和其他經濟變量之間的因果關系。但與工具變量一樣,斷點回歸方法的難點也在于如何尋找一個合適的參考變量(Hahn?et?al.;2001;Thistlethwaite?&?Campbell,1960;Imbens?&?Lemieux,2008;Imbens?&?Kalyanaraman,?2012;Lee?&?Lemieux,?2010;Imbens?&?Rubin,2015;胡安寧,2012)。

6.?雙重差分法與合成控制法

以上這些都是針對截面數據的潛在結果模型,而當使用縱向數據時,時間的信息能夠幫助我們在一定程度上消除內生性的影響。經典的雙重差分法(Difference-in-Difference,DID)假設處理組與控制組擁有相同的線性趨勢,因此總體的平均處理效應可以通過兩次差分得到:首先分別對處理組和控制組在處理實施前后平均結果進行差分,求得每個組的結果變量Y組隨時間增長的量(Tw(1)=Yt(1)w(1)-?Yt(0)w(1),Tw(0)=Yt(1)w(0)-?Yt(0)w(0));然后再對這兩個差值進行差分。由于處理組與控制組擁有共同的線性趨勢,因此第二次差分得到的結果便是處理變量的平均處理效應T=?Tw(1)—?Tw(0)。模型的第一次差分是求自己與自己的差,這樣既控制了時間增長的影響,也消除了個體的異質性的影響;而模型對平均因果效應的估計是基于處理組與控制組“增量”的差值,從而避免了個體和時間因素帶來的影響,在混雜因素不隨時間變化的情況下能夠對平均處理效應做出準確的估計(Ashenfelter,1978;周黎安、陳燁,2005;陳林、伍海軍,2015;?Athey?&?Imbens,2017)。DID是用于總體的平均因果效應的估計,當研究對象是單個個體時,則可以使用合成控制法(Synthetic?Control?Method,SCM)進行因果推斷。合成控制法的核心思想是使用若干個控制組的樣本合成一個在其他特征上與處理組的個體一致的樣本,從而構造出處理組個體的反事實來進行因果推斷(Abadie?&?Gardeazabal,2003;Abadie?et?al.,?2010,2014;Athey?&?Imbens,2017)。

(三)機器學習方法對潛在結果模型的改進

近年來,隨著機器學習方法的發展,統計學、計算科學和社會科學的研究者開始使用機器學習方法來助力因果推斷(胡安寧,2018)。因果推斷在機器學習領域的進展可以歸納為兩類,一類是使用機器學習算法來對傳統的潛在結果模型進行改進;另一類是在潛在結果框架下結合多種模型的思想發展出新的因果推斷的機器學習模型。如前文所述,潛在結果模型進行因果推斷可分為兩步:控制混雜因素來消除分配機制對潛在結果的影響和對總體平均處理效應進行估計,上文中所介紹的潛在結果模型的這兩個部分都可以用機器學習的方法來進行改進。

我們對樣本進行匹配和加權是為了平衡協變量在處理組和控制組的分布,機器學習方法通過兩種途徑來對這一目標進行優化。第一種是提出直接以提高協變量在兩組分布的均衡性為目標的匹配算法——遺傳匹配(Genetic?Matching)(Diamond?&?Sekhon,2013)[7]和D-AEMR匹配算法[8](Dynamic?Almost-Exact?Matching?with?Replacement)(Dieng?et?al.,2019)。第二種途徑是通過提高對傾向值估計的準確性來間接提高協變量分布的均衡性,目前第二種途徑在實際應用中更為普遍。傳統PSM和IPTW模型使用logistic回歸來估計傾向值,其本質是基于一定特征(協變量X)對個體接受處理的概率進行預測,機器學習模型則十分擅長以預測為目標的任務。理論上所有可用于分類(預測類別)的機器學習模型都可以用來計算傾向值,而且目前已有大量文獻使用不同機器學習模型對PS進行預測,并對這些模型的表現進行評估。

Stuart(2010),Sizemore和Alkurdi(2019),Yao等人(2020),?Kreif與?Diazordaz(2019)都對潛在結果模型中的匹配方法及其機器學習進展進行了綜述,詳細介紹了各種基于匹配的因果推斷的傳統和機器學習方法。后者在綜述的基礎上還使用6個模擬數據集對比了遺傳匹配與分別使用logitsic回歸、RF、Xgboost計算PS值的PSM模型在計算處理組的平均處理效應(Average?Treatment?effect?on?Treated?Group,ATT)上的表現結果發現遺傳匹配在所有數據集上的表現都很差,傳統的基于logistic回歸的傾向性匹配模型反而在總體上表現最好。Linden和Yarnold(2016)使用實證數據對比了傳統logistic回歸和支持向量機(Support?Vector?Machine,SVM)、隨機森林和分類樹分析(Classification?Tree?Analysis,CTA)三種機器學習在識別個體是否接受處理(預測傾向值)上的表現,結果發現,CTA使用最簡潔的模型達到了最高的預測準確率,且CTA能夠提供透明的決策過程,方便研究者闡釋研究結果。Westreich等人(2010)則從理論上分析了神經網絡(Neural?Network,NN)、SVM,CART和提升算法(boosting)相比于傳統的logistic?regression的優缺點,為研究者進行模型選擇提供理論上的指導。

Lee等人(2010)使用模擬數據來評估logistic回歸與基于分類回歸樹(Classification?And?Regression?Tree,CART)模型[包括CART,剪枝的(prune)CART和CART的三種集成學習變種(bagged?CART,Random?Forest,boosted?CART)]在用于逆概加權估計時的模型表現差別。研究者模擬出3種不同規模,且存在7種不同程度的非累加性和非線性的情境下的數據,然后對比不同模型在協變量平衡性、處理效應估計偏誤(SE)、離正確系數差距的比例、落在95%置信區間的比例,以及權重的分布這幾個標準上的差別,結果發現,集成方法中的隨機森林和boosted?CART在任何樣本規模、任何情景下都持續表現良好(Lee,?2010)。

而提高傾向值估計的準確性使協變量達到平衡是不是就意味模型對平均因果效應的估計會更好呢?Setoguchi等(2008)分別使用只含有主效應的logistic回歸和遞歸劃分算法(Recursive?Partitioning)、神經網絡等數據挖掘算法來計算傾向值,根據不同模型計算出的傾向值來進行匹配并估計處理效應。在7組模擬數據上的研究結果發現,隨著協變量之間的關系的復雜性增加,數據挖掘模型比logist回歸模型在估計傾向值上會有更好的表現。這說明數據挖掘模型更擅長尋找協變量之間非線性和非累加性的關系。而對于估計處理效應,logistic回歸只適合協變量關系為線性、累加性的情況,當變量之間的關系變得復雜,logistic回歸對處理效應的估計的偏誤也會增加。而神經網絡模型在預測傾向值和估計處理效應的都高出其他模型。目前已有一些研究使用機器學習算法來提高對處理效應估計的準確性(Kreif?&?Diazordaz,2019;Austin,2012;Athey?et?al.,?2018),其典型的方法是使用貝葉斯回歸來替代傳統的回歸模型(Hill,?2011;Hahn?et?al.,?2017)。

除匹配和加權方法外,機器學習方法也可以與工具變量、斷點回歸、合成控制法等進行結合。李超、求文星(2021)回顧了機器學習對IV、RDD、SCM等傳統潛在結果模型的改進,他們認為機器學習對IV的改進主要體現在對IV估計量的構造;而對RDD的改進主要體現在局部斷點機制的識別和回歸模擬方面;對RDD的主要改進在于構造了更合理的虛擬控制組來進行反事實推斷。工具變量可以與LASSO結合,可以在存在多個可能的工具變量的情況下篩選出對控制內生性和提高結果估計準確性的有重要作用的工具變量(Belloni?et?al.,?2017;?Gilchrist?&?Sands,?2016);工具變量與深度神經網絡(deep?network)結合,可以解決高維協變量和工具變量情況下人群受到IV的沖擊存在異質性的問題[9](Hartford,2006;Yao?et?al.,2020)。通過設計自動的統計機器學習算法(automated?statistcal?machine?learning?method)可以自動發現局部斷點回歸機制,并用模擬數據和實證數據驗證了這一方法的有效性;此外,斷點回歸還可以與高斯回歸和貝葉斯回歸結合來更好地擬合斷點兩側的干預組和控制組(Herlands?et?al.,2018;?Branson?et?al.,2019;?李超、求文星,2021)。

機器學習不僅可以對原有的潛在結果模型進行改進,也有學者將機器學習算法和潛在結果框架結合起來,提出新的具備因果推斷能力的機器學習方法。其典型代表是將潛在結果框架引入樹形模型的算法中,發展出可以計算平均因果效應的因果樹(Causal?Tree)、因果森林(Causal?Forest)和貝葉斯累加回歸樹(Bayesian?Additive?Regression?Trees,BART)。得益于樹模型特殊的結構優勢,使用樹模型進行因果推斷可以估計處理變量在不同的子群體中的異質性因果效應(Athey?&?Imbens,2015,2016,2019;Wager?&Athey,2018;Athey?et?al.,2019;?Kapelner?&?Bleich,2013;Chipman?et?al.,2010;?Hill?et?al.,?2020;Hahn?et?al.,?2020;?關于這兩種方法及其應用的介紹參見:胡安寧、吳曉剛、陳云松,2021)。

三、因果網絡模型

(一)因果網絡模型的起源

因果網絡模型(Causal?Diagram?Model)是一種概率圖模型,其最早的起源可以追溯到哲學家Reichenbach(1959/1923)提出的因果關系的概率論理論(Probablilistic?Theories?of?Causation)。Reichenbach試圖通過共同原因準則(Principle?of?Common?Cause)來確定因果關系中的方向性問題(Reichenbach,1959/1923;Beebee?et?al.,?2009)。共同原因準則是指:如果A和B同時發生的概率要大于A和B分別出現的概率的乘積,即P(AB)>P(A)P(B),那么A和B一定存在一個共同原因C將A、C、B連接成一個二叉結構(fork?conjunction)。

圖1 二叉結構

A、B、C滿足:給定C的情況下,A和B條件獨立,且與C不發生時(C')相比,C發生時A發生的概率更大,即滿足A⊥B?|?C,?P(A|C)?>?P(A|C'),P(B|C)>P(B|C'),這也就意味著,如果C發生,那么A和B都發生的概率要比A和B單獨同時發生時的概率更大,通過控制共同原因C使得我們可以發現A和B之間真正的相關關系。Reichenbach的核心觀點是我們可以用這一共同原因原則來確定因果關系的方向性,進而確定時間上的先后順序。如果存在一個二叉結構的A→C←B使得上述這一共同原因準則能夠成立,并且沒有其他的條件C1也滿足于A和B的這一關系,那么我們就認為C是A和B的共同原因,并且C先于A和B。在此基礎上Reichenbach將這一分析拓展到對因果關系的中間性的分析中,如果存在A、B、C滿足(1)?1?>P(B|C)>P(B|A)>P(B)>0?;?(2)?1>(P(A|C)>P(A|B)C>P(A)>0;??(3)?A⊥B|C。我們就認為C在因果上處于A和B之間(C?is?causally?between?A?and?B)。

Reichenbach率先使用圖(Graph)來表示因果關系,這種圖被他稱為“因果網”(causal?net),其中表示事件的因果序列(A→C→B)的被稱為因果鏈(Causal?Chain)。Good對Reichenbach提出的因果網的理論進行了發展,提出了測量實際因果關系(actual?causation)和潛在因果關系(potential?causation)的方法:F對E的潛在因果傾向性(potential?causal?tendency)的計算公式為。即在給定H條件下,F不發生時E不發生的概率除以F發生時E不發生的概率,再對這個商取對數。其中,H包含所有的自然規律和F發生前的背景條件。如果F是E的潛在原因,F和E需要在H存在的情況下在概率上相關。而F對E的真實的因果關系水平(actual?causal?level)會限制F和E之間的因果網絡的強度。在因果網絡上,從F到E的連邊的強度即為F是E的原因的傾向性,而整個因果網絡的強度(strength)即為所有這些連邊(包括原因之間的相互作用的連邊)的強度的函數(Good,1961;?Beebee?et?al.,?2009)。

因果網的突破性進展始于20世紀70年代,當時人工智能的研究者為了在面對不確定性的情況下能夠讓機器實現自動推理而發展出一些“專家系統”(expert?systems),即把人類的專業知識編進計算機以便計算機調用。早期的專家系統是基于規則的系統(rule-based?systems),即把專業知識編碼成邏輯規則,當計算機讀入一組事實(例如患者的癥狀)時,系統能自動地生成推理。但是這種專家系統的缺陷很快被暴露,因為這些系統的專業知識都只是一般的情況,幾乎不包含特例。然而現實的情況總是千奇百怪,存在很多不確定性,但舊的專家系統無法應對這種不確定性。為了應對這些不確定性出現了一些非概率的形式體系被發明出來,但都沒有取得很好的效果。后來,一種用概率來推理和表征且用于推理因果關系的形式體系——貝葉斯網絡的形式體系(the?formalism?of?Bayesian?network)誕生(Pearl?,1988)。

(二)貝葉斯因果圖

貝葉斯因果(網絡)圖(Casual?Bayesian?Network)又稱信念網絡(belief?network),它的發展吸收了經濟學家Goldberger和社會學家Duncan的結構方程模型的思想,結合了Neyman-Rubin的反事實框架并采納概率圖模型的概率推理方法和表達形式,用有向無環圖(directed?acyclic?graphical,DAG)來表示多個變量之間的因果關系和因果結構,是一種概率圖形模型(Morgan?&?Winship,2014,2015)。因果網絡模型是將?Bayes網絡加上外部干預來定義外部干預的因果作用,并描述多個變量之間的因果關系。一般有兩種觀點認識它:一種是將DAG看成是表示條件獨立性的模型;另一種觀點則是將其看成是表示數據生成機制的模型。而因果推斷中常常使用的DAG是將其看成數據生成機制的模型(苗旺等,2018)。貝葉斯網絡中的節點代表變量,節點間的邊代表變量之間的直接依賴關系(也可以看成直接因果關系)。因而,貝葉斯網絡圖的結構描述了變量之間的獨立和相關因果關系。在貝葉斯網絡圖上,每個節點都附有一個概率分布,根節點沒有被任何箭頭指向的起點所附的是它的邊緣概率分布P(X),即先驗分布,而非根節點X所附的是條件概率分布P(X|π(X)),即后驗分布。

這些條件概率分布即為子節點(結果)對父節點(原因)的依賴關系。貝葉斯網絡通過對網絡結構和參數的學習來構建變量之間的因果關系。對參數的學習即為計算非根節點的條件概率表,條件概率表的計算使用貝葉斯定理的推導公式:P(A|B)=。首先,我們可以根據數據計算出獨立事件AB的聯合概率P(A∩B),?基于貝葉斯定理,已知事件B發生的概率,B發生的情況下A也同時發生的概率P(A|B)就等于AB同時發生的概率除以B單獨發生的概率。而對網絡結構的學習(即對變量間因果關系的推斷),就變成了變量間獨立性檢驗的問題,如圖2所示,驗證A與B之間的因果關系需要驗證P(A,B|C)是否等于P(A|C)*P(B|C)的問題。

圖2 三種常見的因果關系陷阱

圖2展示了貝葉斯網絡圖中的三種常見的變量關系,在這三個子圖中,A和B之間沒有直接的箭頭連接,說明A和B之間不存在因果關系。但在這三種情況下,如果變量C不可觀測,那么我們就會對A和B進行錯誤的因果推論。圖2-(a)被稱為二叉(fork)圖。在(a)中,C分別是A、B的原因,C發生變化,A、B也會隨之發生變化,如果我們觀察不到C,?那么從A、B的數據來看,A、B是不獨立的,我們會將A、B之間的這種因為有共同原C而產生的相關性錯誤的解讀為A、B之間存在因果關系。而當我們能觀察到C時就可以避免這種錯誤的因果推論。圖2-(b)是鏈式關系(chain),當我們觀察不到C時,A、B之間是相關的,雖然A和B之間沒有直接的關系,但A通過中間變量C影響B,如果當我們能觀察到C并對C進行控制時A、B條件獨立,那么則認為A和B之間不存在因果關系。圖2-(c)的結構叫作對撞機(collider)。A和B都影響C,而當我們能夠觀察到C并控制C時,A和B由于共同結果的條件作用而變得不獨立。

這種用來判斷變量是否條件獨立的圖形化的方法叫作D分割(D-?separation)。D分割是貝葉斯網絡的基礎,根據這一理論,Pearl進一步提出了do算子的概念(Pearl,1995)。Do算子是對有向無環圖中的變量進行干預,從而能夠在反事實的框架下計算父節點對子節點的因果效應。Pearl提出,一個有效的因果模型應該是一個公式體系:Xi=F(Pai,?Ui),Xi、?Pai、?Ui代表所有的變量。Pai是Xi的直接原因,Pearl將其類比為?“父母”(Parents),Ui是所有影響X的其他原因的集合。對變量Xi的干預(intervention)是指切斷Xi與其“父母”的所有聯系,僅僅對某個或某些Xi變量做改變——改變這個或這些Xi的取值或屬性——來達到對Xi的干預,并且在這個系統中的其他因果關系并不受影響,也就是網絡結構不會發生改變。在貝葉斯網絡圖中,do(xi)=x’i表示將圖中指向xi的連邊全部切斷,例如切斷圖(b)中的A→C這一連邊,然后將xi?(C)的取值固定為常數,再計算干預后整個網絡的聯合概率分布,即通過干預C來看C對B的作用(Pearl,1995,2000;?2009;2018;Morgan?&?Winship,2014,2015)。由此可見,Do算子是通過人為的對因果網絡進行外部干預來探討數據生產的機制,Do算子和D分割結合可以對混雜因素進行識別和控制,從而對變量之間的真實的因果關系進行推斷。

苗旺等人(2018)對貝葉斯因果網絡進行了總結,認為因果網絡模型研究中存在兩類問題:一是因果作用的可識別性;識別因果作用的目的與潛在結果的因果模型一致[10]——探討判斷混雜因素的準則并對因果效應進行估計,并且因果網絡模型能夠更精準地對混雜因素進行判斷。二是因果網絡的學習,包括網絡參數學習和網絡結構學習。參數學習是在因果網絡結構已知(通常是研究者基于理論對變量之間的因果關系做出假設來設定因果圖中的節點和連邊)的情況下利用觀察數據來估計參數,貝葉斯網絡參數估計通常采用最大似然估計或貝葉斯方法,根據因果圖中的變量的聯合分布來估計條件概率?pr(xi?|pai)。“在正態隨機變量的情形,?估計給定父節點變量集合pai下Xi的條件正態分布的參數”(苗旺、劉春辰、耿直,2018)。而網絡結構學習則是在網絡結構(連邊)未知的情況下,以數據驅動從觀察數據中學習出網絡結構。

從觀察數據中對因果網絡結構進行學習叫作因果關系發現(Causal?discovery,簡稱因果發現)。蔡瑞初等(2017)對基于非時序觀察數據的因果關系發現的方法進行了全面的綜述,也對從觀察數據中學習貝葉斯網絡結構的方法進行了總結。從觀察數據中學習貝葉斯因果網絡大多數采用基于約束(constraint-based)的方法。這一方法是通過中變量間的條件獨立性來判斷度量特定結構是否存在,因此也被稱為基于條件獨立性的算法,最基本的算法有IC(Inductive?Causation)算法和PC(Peterand?Clark),也有一些研究使用評分或搜索等其他算法(對貝葉斯網絡結構學習算法詳見蔡瑞初、苗旺等人的綜述)。值得一提的是,因果發現并不一定是純數據驅動的,研究者也可以根據已有的理論知識對網絡中的局部結構進行定義,從而提高網絡結構學習的效率和準確性。由于因果發現仍是統計、計算機等學科的前沿領域,尚未發展出可以直接使用來在高維觀察數據中進行因果發現的成熟的方法和模型[11],因此社會科學鮮有使用貝葉斯因果圖來對高維觀察數據進行研究。當前的研究中對社會科學最有啟發性的是將貝葉斯因果網絡用于探索調查數據的變量關系上(Ticehurst?et.al;?Craig?et?al.,2009;范麗珺、?游頂云、張旺等,2010)。其中,Craig?等人(2009)運用美國青少年健康調查(Add?Health)數據,通過貝葉斯因果網絡進行探索性分析,來研究影響青少年抑郁的影響因素和各影響因素互相之間的關系(Craig?et?al.,2009)。

(三)從因果關系到因果機制

潛在結果模型的目的和功能是檢驗單個自變量對單個因變量的因果關系并估計因果效應,這些方法本身并不能揭示因果關系的作用機制,也不能反映多個變量之間的因果結構。而當前社會科學已經不滿足于只探討兩個變量之間的因果關系,越來越多的研究者認為我們對因果問題的研究僅僅推斷因果關系是不夠的,還需要揭示原因對結果的作用機制(Hedstr?m,2005;Hedstr?m?&?Ylikoski,2010)。“因果概念如果要客觀意義,一定要包含對因果機制的解釋”(彭玉生,2011)。

因果機制理論分為橫向和縱向兩種視角(Casini?&?Manzo,2016)。在橫向的因果機制理論視角下,因果機制是指“變量之間的一種非常穩健的關系網絡”[12];是“被反事實的相關關系所聯系起來的包含實體的模塊化的集合”[13](Knight?&?Winship,2013);是一個“包含著在處理變量和結果之間存在一個或多個中介變量的因果關系”[14](?Morgan?&?Winship,2014)。也就是說,橫向因果機制必須包含因果性和結構性,即在反事實的框架下尋求多個變量之間的因果結構。而因果網絡模型既可以推斷因果關系、估計因果效應,也可以識別因果的網絡結構,因此,使用貝葉斯因果圖不僅可以進行推斷因果關系,也描繪出因果的作用機制(梁玉成、賈小雙,2021)。

而縱因果機制的縱向視角則認為,“機制”是指在一個由個體之間的互動產生系統層面的結果的“復雜系統”中,個體在互動中體現出的穩定的關系;機制性的解釋就是探究復雜系統中個體的互動如何涌現出宏觀現象。縱向因果機制強調生成性,即原因導致結果產生的過程(Machamer,?2000;Bechtel?&?Abrahamsen,?2005;Glennan,?2002;Hedstr?m?&?Swedberg?,?1998;Hedstr?m,2005;Hedstr?m?&?Ylikoski?2010;Hedstr?m?et?al.,2009)。因此,基于自主行動者建模(Agent-based?Modeling,ABM)是分析縱向因果機制的不二之選(Casini,2016;梁玉成、賈小雙,2021)。

四、ABM與因果機制分析

ABM,是一種通過自下而上(bottom?up)的方式來研究復雜社會系統的方法(Wooldridge,?2009;Axtell,?Epstein?&?Young,?2006)。其方法的特點在于,“ABM是通過無中心的、局部的、異質性的自主行動個體,來研究社會規律如何出現”(Epstein,1999,2006)。ABM通過在計算機中設定大量自主行動者,它們是具有認知、決策判斷和行動能力個體。在研究中,研究者根據所要研究的現象,在模型中設置不同的行動者,并根據需要設定不同的角色,賦予其特定的認知能力、先賦的資源稟賦,以及判斷流程和行動模式。然后足夠數量的自主行動者被放置在一個人工建構的世界中,隨著時間的進程,各自不斷地重復“外部認知、策略判斷、展開行動”的過程,從而通過行動者之間,以及行動者和世界之間的不斷互動,進而涌現出宏觀社會現象。簡單來說,ABM是在一個研究者模擬出的世界中來看自主行動者在什么樣的規則的作用下、如何演化出特定的宏觀現象(Epstein,1999,2006;Bianchi?&?Squazzoni,2015;Bruch?&?Atwell,?2015)。在模擬中研究者可以開啟“上帝視角”來改變行動者行動和互動的規則,創造各種(包括反事實)的情境來研究“原因”引起(bring?about)“結果”的過程。

ABM發展的早期是從概念模型開始的,研究者的ABM模型設置和檢驗往往都屬于理論或經驗。在進行模型的參數設置時,學者們通常對模型參數(如行動者的性別、年齡、行動偏好等)的初始值進行隨機設置(由不同的隨機數種子而隨機進行的),在同樣的參數設置下模型每次運行也都會出現差別化的結果。通過這類模型研究因果關系的做法遭到了猛烈的批判:因為ABM研究中有一個非常重要的特點——模擬復雜系統的模型的初始設置和互動的規則設置,往往會影響甚至決定模型模擬的結果。復雜系統的初始條件決定行動者的空間分布,決定行動者所處的環境,甚至有時候決定著行動者的行為模式,因此復雜系統模型的初始化設置和規則設置若不符合現實狀況,便很難模擬出真實的社會現象。其次,如果這些設置的假設無法從現實中得到經驗數據的驗證,如何證明模型的真實性?(Prietula,?Carley?&?Gasser1998;?Boero?,?Squazzoni,?2005)。

面對這一批判,學者們開始對這一模型進行改進,發展出數據驅動ABM(Data-driven?ABM),提倡用實證數據來進行模型的校準(model?calibration)和模型的校驗(model?validation),從而確保模型的穩健性和準確性的一種社會模擬方法(Zhang?et?al.,?2015;Oreskes,Shrader-Frechette?&?Belitz,1994)。Hassan等人提出將實證數據引入ABM的5個步驟:(1)研究者需要從現實社會中收集實證數據;(2)根據實證數據(如方程、一般化和類型化的社會事實、專家提供的定性數據)、相關理論及研究者的研究假設來設計ABM模型;(3)根據社會調查、人口普查等實證數據來初始化模型;(4)運行模型,輸出結果;(5)對模型進行檢,將模型輸出的數據與實證數據進行比較。需要注意的是,為了保證模型檢驗和模型設計相互獨立,我們在進行模型檢驗時應避免使用模型設計和初始化過程中所使用的相同的數據(Hassan,?Pavon?&?Gilbert,2008;Squazzoni,?2012;Smith?&?Conrey,2007)。

Casini對ABM的類型做了詳細的分類:根據是否有理論來源,是否使用現實數據初始化模型,模型是否通過現實數據校驗這三個條件,他將目前的ABM分為處于思維實驗—數據驅動的ABM之間的8種類型,并詳細論證了在什么情況下模型具有識別因果關系和發現因果機制的能力。顯然,當這三個條件完全滿足時,模型具有因果推論能力(Casini,2016)。然而現實中ABM很難滿足這些條件,尤其是對模型的校準(calibration)的要求,?因為我們校準模型用的數據主要來自抽樣調查數據和實驗數據,而基于這些數據,我們一般只能用函數的方式(大多數是回歸)來模擬行動者不同特征之間的規則,但真實的數據生成機制很可能是非線性的(Hedstr?m?&?Manzo,?2015)。

除此之外,ABM還面臨著一些其他的爭議,一方面,ABM模擬的真實性與模型的復雜性之間的trade-off難以平衡(Boero?et?al.,?2005);另一方面,能夠涌現出同樣宏觀現象的規則可能不止一個,我們無法保證通過ABM得出的因果機制是真實的因果機制(Casini,2016)。ABM的諸多限制及其在因果推論上面臨的質疑使得社會科學研究者較少使用這一方法來進行因果推斷。但由于ABM具備能夠反映出宏觀現象的涌現過程的獨特優勢,雖然不能進行因果推斷,但也能基于一些既定的因果關系作出一些機制性的解釋。我們可以先采用潛在結果模型或因果網絡模型對因果作用進行推斷,然后再將實證數據注入來設置ABM模型參數,從而對因果作用的過程提供一個可能的機制性的解釋(梁玉成、賈小雙,2021)。

五、結論

本文基于反事實框架對社會科學中因果分析的潛在結果模型、因果網絡模型和ABM三大方法論體系進行了梳理,回顧了每個方法論的核心概念和思想,并對主要的模型進行了回顧。其中,潛在結果模型的方法論體系更為完善,其模型和方法更為成熟,實際應用相對其他方法而言也更加可行。因此,本文對社會科學中常見的潛在結果模型——包括針對混淆變量可觀測的截面數據的傾向值與其他匹配方法、加權方法;針對存在不可觀測混淆變量的時序觀察數據的工具變量法、斷點回歸;以及針對存在不可觀測變量的縱向數據的雙重差分法與合成控制法——的核心思想進行了回顧,并介紹了這些方法與機器學習結合的最新進展。而由于因果網絡模型尚未發展成熟,ABM的使用及其因果推斷能力存在限制,社會科學研究中使用這兩種方法進行因果推斷的研究較少。但身處大數據時代,隨著方法和技術的不斷發展,因果推斷領域將持續被更多的學者關注,在解決因果問題上取得更豐富的進展。

參考文獻

蔡瑞初、陳薇、張坤等,?2017,《基于非時序觀察數據的因果關系發現綜述》,《計算機學報》第40卷第6期。

陳林、伍海軍,?2015,《國內雙重差分法的研究現狀與潛在問題》,《數量經濟技術經濟研究》第7期。

陳云松、范曉光,?2010,《社會學定量分析中的內生性問題測估社會互動的因果效應研究綜述》,《社會》第30卷第4期。

陳云松,?2012,《邏輯、想象和詮釋:?工具變量在社會科學因果推斷中的應用》,《社會學研究》第6期。

郭申陽,2012,《傾向值分析:統計方法與應用.?傾向值分析:統計方法與應用》,重慶:重慶大學出版社。

胡安寧、吳曉剛、陳云松,?2021,《處理效應異質性分析——機器學習方法帶來的機遇與挑戰》,《社會學研究》第1期。

胡安寧,2012,《傾向值匹配與因果推論:方法論述評》,《社會學研究》第1期。

胡安寧,2018,《以機器學習方法助力因果推斷》,《中國社會科學報》8月22日。

蔣建忠,2017,《匹配與社會科學因果推論》,《實證社會科學》(第四卷)。

李超、求文星,2021,《基于機器學習的因果推斷方法研究進展》,《統計與決策》第37卷第11期。

李文釗,2018,《因果推理中的潛在結果模型:起源,邏輯與意蘊》,《公共行政評論》。

梁玉成、賈小雙,2021,《橫向因果與縱向因果——計算社會科學的范式探討》,《天津社會科學》第1期。

孟天廣,2017,《從因果效應到因果機制:實驗政治學的中國路徑》,《探索》第5期。

孟天廣,2018,《政治科學視角下的大數據方法與因果推論》,《政治學研究》第140卷第3期。

苗旺、劉春辰、耿直,2018,《因果推斷的統計方法》,《中國科學:數學》第48卷第12期。

彭玉生,2011,《社會科學中的因果分析》,《社會學研究》第3期。

王天夫,2006,《社會研究中的因果分析》,《社會學研究》第4期。

周黎安、陳燁,2005,《中國農村稅費改革的政策效果:基于雙重差分模型的估計》,《經濟研究》第8期。

Abadie,A.,Diamond,A.&?Hainmueller,J.2010,“Synthetic?control?methods?for?comparative?case?studies:?Estimating?the?effect?of?California’s?tobacco?control?program.”?Journal?of?the?American?statistical?Association?105(490).

Abadie,A.,Gardeazabal,J.2003,“The?economic?costs?of?conflict:?A?case?study?of?the?Basque?Country.”?American?economic?review?93(1).

Abadie,A.?&?G.?W.?Imbens?2016,“Matching?on?the?estimated?propensity?score.”?Econometrica?84?(2).

Abbott,A.1998,“The?Causal?Devolution.”?Sociological?Methods?and?Research?27(2).

Angrist,J.D.,?Imbens,G.?W.,?Rubin,D.?B.1996,“Identification?of?causal?effects?using?instrumental?variables.”?Journal?of?the?American?statistical?Association?91(434).

Angrist,J.D.,Krueger,A.B.2001,“Instrumental?Variables?and?the?Search?for?Identification:?From?Supply?and?Demand?to?Natural?Experiments.”?Journal?of?Economic?Perspectives?15(4).

Ashenfelter,O.1978,“Estimating?the?effect?of?training?programs?on?earnings.”?The?Review?of?Economics?and?Statistics.

Athey,S.,Bayati,M.,Imbens,&?G.,et?al.?2019,“Ensemble?methods?for?causal?effects?in?panel?data?settings.”AEA?Papers?and?Proceedings?109.

Athey,S.,Imbens,G.?W.,?&?Wager,?S.2018.?“Approximate?residual?balancing:?debiased?inference?of?average?treatment?effects?in?high?dimensions.”?Journal?of?the?Royal?Statistical?Society:?Series?B?(Statistical?Methodology)??80(4).

Athey,S.,Imbens,G.W.2015,“Machine?learning?methods?for?estimating?heterogeneous?causal?effects.”?stat?1050(5).

—2016.“Recursive?partitioning?for?heterogeneous?causal?effects.”?Proceedings?of?the?National?Academy?of?Sciences?113(27).

Athey,S.,Imbens,G.W.?2017,“The?state?of?applied?econometrics:?Causality?and?policy?evaluation.”?Journal?of?Economic?Perspectives??31(2).

Athey,?S.,?Guido,W.&?Imbens?2017,“The?State?of?Applied?Econometrics:?Causality?and?Policy?Evaluation.”?JEP??31?(2).

Athey,?S.,?Imbens,G.W.?2017,“The?State?of?Applied?Econometrics:?Causality?and?Policy?Evaluation.”?JEP?31?(2).

Austin,P.?C.?2012,“Using?ensemble-based?methods?for?directly?estimating?causal?effects:?an?investigation?of?tree-based?G-computation.”?Multivariate?behavioral?research?47(1).

Axtell,R.L,?Epstein,J.?M.?&?Young,H.?P.?2012,The?emergence?of?classes?in?a?multi-agent?bargaining?model.Princeton?University?Press.

Bang,H.,Robins,J.M.?2005,“Doubly?robust?estimation?in?missing?data?and?causal?inference?models.”?Biometrics?61(4).

Bechtel,W.&?Abrahamsen?A,?2005,“Explanation:?A?mechanist?alternative.”?Studies?in?History?and?Philosophy?of?Science?Part?C:?Studies?in?History?and?Philosophy?of?Biological?and?Biomedical?Sciences???36(2).

Beebee,H.?&?Hitchcock,C.,Menzies,P.2009,The?Oxford?Handbook?of?Causation.?Oxford?University?Press.

Belloni,A.,Chernozhukov,V.?&?Fernández-Val?I,?et?al.“2017?Program?Evaluation?and?1:1048576?Inference?With?High-?dimensional?Data?.”Econometrica?85(1).

Bianchi,?F.?&?Squazzoni,?F.?2015.?“Agent-based?Models?in?Sociology.”?Computational?Statis-?tics?7(4).

Boero,R.?&?Squazzoni,?F.?2005,“Does?empirical?embeddedness?matter??Methodological?issues?on?agent-based?models?for?analytical?social?science.”?Journal?of?artificial?societies?and?social?simulation??8(4).

Bruch,?E.?&?Atwell,?J.2015,“Agent-Based?Models?in?Empirical?Social?Research.”?Sociological?Methods?and?Research?44(2).

Casini,?L.?&?Manzo,?G.2016,“Agent-based?models?and?causality:?a?methodological?appraisal.”

Chipman,H.?A,?George,E.?I.?&?McCulloch,R.?E.?2010,“BART:?Bayesian?additive?regression?trees.”?The?Annals?of?Applied?Statistics??4(1).

Craig,?Carlton,D.,?Sprang,?et?al.?2009,“Exploratory?and?Confirmatory?Analysis?of?the?Trauma?Practices?Questionnaire.”?Research?on?Social?Work?Practice?19(2).

Czajka,J.L.,?Hirabayashi,S.M.,?Little,R.?J.?A.,?et?al.?1992,“Projecting?from?advance?data?using?propensity?modeling:?An?application?to?income?and?tax?statistics.”?Journal?of?Business?&?Economic?Statistics??10(2).

Dieng,?A.,?Liu,?Y.,?Roy,?S.,?Rudin,?C.,?&?Volfovsky,?A.2019,“Interpretable?almost-exact?matching?for?causal?inference.”?In?The?22nd?International?Conference?on?Artificial?Intelligence?and?Statistics?(pp.?2445-2453).?PMLR.

Epstein,J.M.,Axtell,R.1996,Growing?artificial?societies:?social?science?from?the?bottom?up.?Brookings?Institution?Press.

Epstein,J.?M.1999,“Agent-Based?Computational?Models?and?Generative?Social?Science.”?Complexity?4(5).

Epstein,?J.?M.2006,?Generative?Social?Science:?Studies?in?Agent-Based?Computational?Modeling.?Princeton:?Princeton?University?Press.

Feng,G.,?Quirk,J.?G.,Djuri?,P.?M.2019,“Detecting?Causality?using?Deep?Gaussian?Processes.”?In?2019?53rd?Asilomar?Conference?on?Signals,?Systems,?and?Computers?(pp.?472-476).?IEEE.

Fisher,R.?A.1935,?“The?Design?of?Experiments.”?Oliver?and?Boyd.

Gilchrist,D.S.,Sands,E.G.2016,“Something?to?talk?about:?Social?spillovers?in?movie?consumption.”Journal?of?Political?Economy?124(5).

Glennan,S.S.1996,“Mechanisms?and?the?nature?of?causation.”?Erkenntnis?44(1).

Goldthorpe,J.H.2001,“Causation,?Statistics?and?Sociology.”?European?Sociological?Review?17(1).

Good,I.J.1961,“A?causal?calculus?(I).”?The?British?journal?for?the?philosophy?of?science?11(44).

Hahn,J.,Todd,P.,Van?der?Klaauw.W.,2001,“Identification?and?estimation?of?treatment?effects?with?a?regression-discontinuity?design.”?Econometrica?69(1).

Hahn,P.R.,Murray,J.S.,Carvalho,C.M.?2020,“Bayesian?regression?tree?models?for?causal?inference:?Regularization,?confounding,?and?heterogeneous?effects?(with?discussion).”?Bayesian?Analysis?15(3).

Hahn,P.R.,J.S.Murray,C.M.Carvalho?2017,“Bayesian?regression?tree?models?for?causal?inference:?regularization,?confounding,?and?heterogeneous?effects.”

Hartford,J.,Lewis,G.,Leyton-Brown,K.,et?al,2017,“Deep?IV:?A?flexible?approach?for?counterfactual?prediction.”International?Conference?on?Machine?Learning.?PMLR:?1414-1423.

Hassan,S.,Pavo??n,J.,Antunes,L.,&?Gilbert,N.,2010,“Injecting?Data?into?Agent-Based?Simulation.”?In?Takadama,?K.,?Deffuant,?G.,?and?Cioffi-Revilla,?C.,?editors,?Simulating?Interacting?Agents?and?Social?Phenomena:?The?Second?World?Congress?Springer,?Tokyo?(2010),volume?7?of?Springer?Series?on?Agent?Based?Social?Systems,?pages?179–191.?Tokyo:?Springer.

Hedstro??m,P.?&?Bearman,P.,2009,The?Oxford?Handbook?of?Analytical?Sociology.?Oxford:?Oxford?University?Press.

Hedstr?m,P.,Manzo,G.,2015,“Recent?trends?in?agent-based?computational?research:?A?brief?introduction.”?Sociological?Methods?&?Research?44(2).

Hedstr?m,P.2005,Dissecting?the?Social.?On?the?Principles?of?Analytical?Sociology.?Cam-?bridge:?Cambridge?University?Press.

Hedstr?m,P.,?&?Swedberg,R.1998,“Social?mechanisms:?An?introductory?essay.”?Social?mechanisms:?An?analytical?approach?to?social?theory.

Hedstr?m,P.,&?Ylikoski,P.?2010,“Causal?mechanisms?in?the?social?sciences.”?Annual?review?of?sociology,?36.

Hill,J.L.,2011,“Bayesian?nonparametric?modeling?for?causal?inference.”?Journal?of?Computational?and?Graphical?Statistics?20(1).

Hirano,K.,Imbens,G.W.,Ridder,G.?2003,“Efficient?estimation?of?average?treatment?effects?using?the?estimated?propensity?score.”?Econometrica?71(4).

Holland,Paul,W.1986,“Statistics?and?causal?inference.”?Journal?of?the?American?statistical?Association?81.

Iacus,S.,Blackwell,M.,King,G.,et?al.?2009,“Cem:?Coarsened?exact?matching?in?Stata.”?The?Stata?Journal??9(4).

Imbens,G.W.,Lemieux,T.?2008,“Regression?discontinuity?designs:?A?guide?to?practice.”?Journal?of?econometrics?142(2).

Imbens,G.W.?2008,“Matching?Methods?in?Practice:?Three?Examples.”?Journal?of?Human?Resources?50(2).

Imbens,G.,Kalyanaraman,K.,2012,“Optimal?bandwidth?choice?for?the?regression?discontinuity?estimator.”?The?Review?of?economic?studies?79(3).

Imbens,G.?W.,&?Rubin,D.?B.2015,Causal?inference?in?statistics,?social,?and?biomedical?sciences.?Cambridge?University?Press.

Kapelner,A.,Bleich,J.,2013,“Bartmachine:?A?powerful?tool?for?machine?learning.”Stat?1050.

Kreif,N.&?Diaz?Ordaz,K.2019,“Machine?learning?in?policy?evaluation:?new?tools?for?causal?inference.”arXiv?preprint?arXiv:1903.00402.

Lee,B.K.,Lessler,J.&?Stuart,E.A.2010,“Improving?propensity?score?weighting?using?machine?learning.”?Stat?Med?29(3).

Lee,D.?S.&?Lemieux,T.2010,“Regression?discontinuity?designs?in?economics.”?Journal?of?economic?literature?48(2).

Leuven,E.?&?Sianesi,B.2003,PSMATCH2:?Stata?module?to?perform?full?Mahalanobis?and?propensity?score?matching,?common?support?graphing,?and?covariate?imbalance?testing.

Lewis,D.1986,Philosophical?Papers?II.Oxford?University?Press.Page:?159-172?“Causation”.

Lewis,D.?2001,Counterfactuals.Blackwell.

Linden,A.&?Yarnold,P.R.2016,“Using?machine?learning?to?assess?covariate?balance?in?matching?studies.”?Journal?of?Evaluation?in?Clinical?Practice?22.

Lunceford,J.K.&?Davidian,M.?2004,“Stratification?and?weighting?via?the?propensity?score?in?estimation?of?causal?treatment?effects:?a?comparative?study.”?Statistics?in?medicine?23(19).

Machamer,P.Darden,L.&?Craver,C.F.2000,“Thinking?about?mechanisms.”?Philosophy?of?science?67(1).

Mill,J.?S.?2011,A?System?of?Logic.?eBooks@Adelaide

Neyman,J.&?Iwaszkiewicz,K.1935,“Statistical?problems?in?agricultural?experimentation.”?Supplement?to?the?Journal?of?the?Royal?Statistical?Society??2(2).

Neyman,J.?S.1923,On?the?application?of?probability?theory?to?agricultural?experiments.?essay?on?principles.?section?9.(tlanslated?and?edited?by?dm?dabrowska?and?tp?speed,?statistical?science?(1990),?5,?465-480).?Annals?of?Agricultural?Sciences,?10,?1-51.

Oreskes,N.Shrader-Frechette,K.&?Belitz,K.1994,“Verification,?validation,?and?confirmation?of?numerical?models?in?the?earth?sciences.”?Science?263(5147).

Pearl,J.&?Mackenzie,D.2018,“The?book?of?why?:?the?new?science?of?cause?and?effect.”?Science?361(6405).

Pearl,J.1995,“Causal?diagrams?for?empirical?research.”Biometrika??82(4).

Pearl,J.1988,Probabilistic?reasoning?in?intelligent?systems:?networks?of?plausible?inference.?Morgan?kaufmann.

Pearl,J.2009,Causality:?Models,?Reasoning,?and?Inference.Cambridge?University?Press,?New?York.?2nd?edition.?MR1744773

Pearl,J.&?Mackenzie,D.2018,The?Book?of?Why:?The?New?Science?of?Cause?and?Effect?(1st?ed.).?Basic?Books,?Inc.,?New?York,?NY,?USA.

Prietula,M.Carley,K.&?Gasser,L.?1998,“Simulating?organizations:?Computational?models?of?institutions?and?groups.”The?MIT?Press.

Reichenbach,H.,1959,Modern?philosophy?of?science:?Selected?essays.轉引自The?Oxford?handbook?of?causation.?Oxford?University?Press,?2009.

Rosenbaum,P.R.&?Rubin,D.?B.?1983,“The?central?role?of?the?propensity?score?in?observational?studies?for?causal?effects.”?Biometrika??70(1).

Rubin,D.?B.1974,“Estimating?Causal?Effects?of?Treatments?in?Randomized?and?Nonrandomized?Studies.”?Journal?of?Educational?Psychology?66(5).

Rubin,Donald,B.1980a,“Bias?Reduction?Using?Mahalanobis-Metric?Matching.”?Biometrics?36.

Rubin,D.B.1977,“Assignment?to?Treatment?Group?on?the?Basis?of?a?Covariate.”?Journal?of?Educational?Statistics?2.

—1978,“Bayesian?Inference?for?Causal?Effects:?The?Role?of?Randomization.”?Annals?of?Statistics?6.

—1980a,“Bias?Reduction?Using?Mahalanobis-Metric?Matching.”?Biometrics?36.

—1980b,“Comment?on?‘Randomization?Analysis?of?Experimental?Data?in?the?Fisher?Randomization?Test’?by?Basu.”?Journal?of?the?American?Statistical?Association?75.

—1981,“Estimation?in?Parallel?Randomized?Experiments.”?Journal?of?Educational?Statistics?6.

—1986,“Which?Ifs?Have?Causal?Answers?(Comment?on?‘Statistics?and?Causal?Inference’?by?Paul?W.?Holland).”?Journal?of?the?American?Statistical?Association?81.

—1990,“Formal?Modes?of?Statistical?Inference?for?Causal?Effects.”?Journal?of?Statistical?Planning?and?Inference?25.

—2005,“Causal?Inference?Using?Potential?Outcomes:?Design,?Modeling,?Decisions.”?Journal?of?the?American?Statistical?Association?100.

Setoguchi,S.,Schneeweiss,S.,Brookhart,M.A.,Glynn,R.J.&?Cook,E.F.?200,“Evaluating?uses?of?data?mining?techniques?in?propensity?score?estimation:?a?simulation?study.”?Pharmacoepidemiol?Drug?Saf?17.

Smith,E.R.&?Conrey,F.?R.2007,“Agent-based?modeling:?A?new?approach?for?theory?building?in?social?psychology.”Personality?and?social?psychology?review?11(1).

Sizemore,S.?&?Alkurdi,R.2019,Matching?Methods?for?Causal?Inference:?A?Machine?Learning?Update.

Sobel,Michael,E.1996,“An?introduction?to?causal?inference.”Sociological?Methods?&?Research?24,?no.?3.

Squazzoni,F.2012,Agent-based?computational?sociology.?John?Wiley?&?Sons.

Stuart,E.A.2010,“Matching?methods?for?causal?inference:?A?review?and?a?look?forward.”?Statistical?science:?a?review?journal?of?the?Institute?of?Mathematical?Statistics?25(1).

Thistlethwaite,D.L.,Campbell,D.T.1960,“Regression-discontinuity?analysis:?An?alternative?to?the?ex?post?facto?experiment.”?Journal?of?Educational?psychology?51(6).

Ticehurst,B.J.,Curtis,A.?&?Merritt,W.?Can?Bayesian?Networks?aid?analysis?of?survey?data:?A?case?study?of?a?landholder?survey?in?the?Wimmera,?Victoria.

Wager,S.,Athey,S.?2018,“Estimation?and?inference?of?heterogeneous?treatment?effects?using?random?forests.”?Journal?of?the?American?Statistical?Association?113(523).

Westreich,D.,Lessler,J.?&?Funk,M.J.2010,“Propensity?score?estimation:?neural?networks,?support?vector?machines,?decision?trees?(CART),?and?meta‐?classifiers?as?alternatives?to?logistic?regression.”?J?Clin?Epidemiol?63(8).

Winship,C.?&?Morgan,S.L.1999,“The?Estimation?of?Causal?Effects?from?Observational?Data.”Annualreview?of?sociology?25(1).

Winship,C.?&?Sobel,M.2004,“Causal?Inference?in?Sociological?Studies.”?In?Hardy,M.&?Bryman,?A.,editors,?A?Handbook?of?Data?Analysis,pages?480–504.?London:?Sage?Publications.

Wooldridge,M.?An?introduction?to?multiagent?systems.?John?wiley?&?sons,?2009.

Yao,L.,Chu,Z.,Li,S.,Li,Y.,Gao,?J.,&?Zhang,A.2020,A?survey?on?causal?inference.?arXiv?preprint?arXiv:2002.02770.

Zhang,H.,Vorobeychik,Y.,&?Letchford,J.,et?al.2016,“Data-driven?agent-based?modeling,?with?application?to?rooftop?solar?adoption.”?Autonomous?Agents?and?Multi-Agent?Systems?30(6).

[1]作者簡介:賈小雙,中山大學社會學與人類學學院博士生,?研究方向主要為計算社會學、社會分層。聯系郵箱:jiaxsh@mail2.sysu.edu.cn。

[2]對于一個事物我們一次只能觀察到采取了某種策略的結果,而觀察不到假如不采取這種策略會是什么結果,因此,我們能夠觀察到的結果被稱為事實,而觀察不到的被稱為?“反事實”,

[3]潛在結果框架在后期的發展中吸收了各學科思想,包括來自統計學的Fisher(1935,1971)的隨機實驗,來自計量心理學的Thurstone(1930)和經濟學的Haavelmo(1943)、Roy(1951)和Quandt(1958,1972)的思想。關于潛在結果框架的發展歷史性回顧可參見Holland,1986;Sobel,1996;Winship?&?Morgan,1999。

[4]李文釗(2018)在一篇潛在結果模型的綜述《潛在結果模型:起源、邏輯與意蘊》中,對哲學和統計學、社會科學中的反事實框架以及潛在結果模型進行了梳理,詳細地介紹了三者的發展脈絡與核心思想,并闡明了三者之間的關系。他指出,統計學、社會科學中雖然使用了反事實的框架的術語,但其核心內容是依據潛在結果模型來構造的。

[5]SUTVA?is?simply?the?a?priori?assumption?that?the?value?of?Y?for?unit?u?when?exposed?to?treatment?t?will?be?the?same?no?matter?what?mechanism?is?used?to?assign?treatment?t?to?unit?u?and?no?matter?what?treatments?the?other?units?receive.?Rubin(1986:961).

[6]政治學和公共原理、政策研究中使用實驗方法進行因果推理的趨勢正在加強,體現在實驗政治科(?Experimental?Political?Science)的興起和基于因果推理、實驗方法和研究設計的政策評估研究領域的形成?(Druckman?et?al.,2011;Shadish?et?al.,2002;李文釗,2018;孟天廣,2017)。

[7]遺傳匹配是將處理組與對照組的樣本進行配對,然后檢驗配對后的樣本平衡性,在此基礎上更新配對,并重復迭代這一過程,直到達到最優的樣本平衡性遺傳匹配同時使用觀察到的協變量和個體傾向值進行配對,在每一次的迭代中都會產生一個對應的距離度量標準(Distance?Metric),這一度量會導致不同的配對產生。這一度量標準在每次的迭代中都會通過賦予協變量不同的權重而產生變化。因此,這種算法能夠學習到哪些協變量對達到最好的匹配效果最為重要。算法期初會隨機賦予權重,在每一次的迭代過程中,隨著權重的改變,算法通過降低損失函數來達到最優平衡性(Diamond?&?Sekhon,2013)

[8]杜克大學的Dieng及其團隊提出的D-AEMR算法適用于計算非常高緯度的匹配問題。Dieng認為,應該在n維空間[基于加權漢明距離(weighted?Hamming?distance)得到]中進行配對(而不是一維的傾向值),但應該只選擇重要的協變量構建這一空間。D-AEMR使用機器學習的優化算法計算每個協變量的重要性得分,變量的重要性是指變預測Y的能力,而不是預測處理狀態的能力。該算法完全優化了每個樣本對的加權漢明距離,同時,由于它使用位向量算法(bit-vector)且使用database?programming,這種算法非常高效。當匹配質量開始下降時,可以提前結束搜索。

[9]Hartford等人(2016)將工具變量法拆解為兩個階段的有監督學習,且將這兩個階段都可以與深度神經網絡結合起來。在第一階段,將一系列工具變量和協變量“喂”進一個深度神經網絡來擬合處理變量W的條件分布。第二階段,用這個擬合好的條件分布與第二個深度神經網絡結合,來優化損失函數,并且用外部效度(out-of-sample?causal?validation)來調整神經網絡的超參數。大多數的工具變量模型只能識別局部平均處理效應(LATE),但是人群是充滿異質性的,不同的群體可能受到工具變量的沖擊不同。非參數的IV方法可以解決異質性的問題,但是當協變量和工具變量的數量過多時,計算上難以實現,而這種Deep?IV的方法則可以解決這個問題(Hartford,2016)。

[10]Morgan和Winship對do算子與潛在結果模型的關系的分析詳見Morgan?&?Winship,2014,2015。

[11]Tetrad可用于觀察數據的因果發現,但不能處理較高維度的數據,對網絡結構學習的效果也不太理想。

[12]“a?mechanism?is?interpreted?as?a?network?of?variables?that?stand?in?particularly?robust?relations”.

[13]“modular?sets?of?entities?connected?by?relations?of?counterfactual?dependence”.

[14]a?causal?relationship?involving?one?or?more?intervening?variables?between?a?treatment?and?an?outcome.

主站蜘蛛池模板: 南宫市| 尉犁县| 京山县| 迁安市| 榆树市| 松溪县| 什邡市| 阳曲县| 井冈山市| 姚安县| 库车县| 安溪县| 阳山县| 马山县| 兴和县| 湘潭县| 汉沽区| 涟水县| 绥德县| 额敏县| 崇信县| 宁阳县| 白河县| 图们市| 原阳县| 即墨市| 宁陵县| 安福县| 肥乡县| 永顺县| 通州市| 龙泉市| 博乐市| 山西省| 页游| 天镇县| 建德市| 大邑县| 鲁山县| 磴口县| 商城县|