官术网_书友最值得收藏!

1.2 相關性與因果關系

為什么人們會感覺出現了辛普森悖論現象呢?這其實是人們在思維中常常錯誤地將相關性等同于因果關系來使用所導致的。

以例1.2新藥效果的評估問題為例,確實存在“對男性或女性患者,服用新藥比未服用新藥具有更高的康復率”,而“對不區分性別的所有患者,服用新藥比未服用新藥具有更低的康復率”這樣的悖論嗎?

我們引入變量對表1.4提供的統計數據信息進行數學化表達。P(康復=1)表示患者康復的概率,“性別=男性”表示患者性別為男性,“性別=女性”表示患者性別為女性,“服用新藥=1”表示患者服用新藥,“服用新藥=0”表示患者未服用新藥。根據表1.4的統計數據,相應地有下述數學表達式。

根據第一行男性患者的數據,可有

根據第二行女性患者的數據,可有

根據第三行不區分性別的所有患者的數據,可有

在這個例子中,準確地說,式(1.3)提供的信息只是相關性,說明對于不區分性別的所有患者,我們觀察到“服用新藥”患者(“服用新藥=1”)的康復概率要低于“未服用新藥”患者(“服用新藥=0”)的康復概率。但這并不意味著,如果我們主動采取措施,“讓患者服用新藥”后,其康復概率就會低于“不讓患者服用新藥”的康復概率,因為式(1.3)并沒有提供因果關系信息——“服用新藥”就會導致康復概率降低。

同樣,式(1.1)也僅僅說明,對于男性患者,我們觀察到“服用新藥”患者(“服用新藥=1”)的康復概率要高于“未服用新藥”患者(“服用新藥=0”)的康復概率。式(1.1)提供的信息只是“服用新藥=1”和“康復=1”之間的相關性,并不能說明對于男性患者,如果我們主動地采取措施,“讓患者服用新藥”后,其康復概率就會高于“不讓患者服用新藥”的康復概率。式(1.1)也沒有提供這樣的因果關系信息。

顯然,如果式(1.1)和式(1.3)提供的是因果關系信息,那么確實出現了悖論,但式(1.1)和式(1.3)提供的僅僅是觀察性的相關性信息,而這樣的相關性信息是完全可能出現的。我們從純數學的角度來分析,上面這個悖論可以寫成如下的數學形式。

卻有

其實這很正常,由于占比不同的影響,這樣的結果完全可能出現。因此,表1.4的數據事實上并不構成悖論。而之所以我們感覺出現了悖論,是因為我們在思維中常常錯誤地將統計信息中的相關性關系視為(可能自己還沒有察覺到)因果關系。在這樣的案例中,分組數據與總體數據截然相反的相關性結論說明:變量之間的相關關系可以完全被第三個變量所“扭曲”,避免“扭曲”的關鍵在于選擇正確的分組變量對數據進行分組統計、分析。我們來看幾個更加直觀的相關性不等于因果關系的例子。

與冬天相比,夏天游泳的人增多且溺亡人數上升,同時吃冰激凌的人數也增多,因此,我們可以觀察到統計數據——在“吃冰激凌的人數多”時“溺亡人數多”。我們可以得出結論——“吃冰激凌的人數多”和“溺亡人數多”這兩者之間有相關性,而如果我們得出“吃冰激凌的人數多”將會導致“溺亡人數多”這樣的因果關系,這個結論顯然是荒唐的。類似地,我們可以觀察火災事故中的傷亡人數和火災救援中出動的消防車數量之間的統計關系,在所有的火災統計數據中,可以發現,出動“消防車數量多”的火災“傷亡人數多”,我們可以得出結論——火災中“消防車數量多”和“傷亡人數多”之間有相關性,但我們不會得出“消防車數量多”導致了火災中“傷亡人數多”的結論。

這些例子比較直觀,我們通常不會將相關性與因果關系混淆,但類似例1.2中服用新藥和康復率之間的關系,由于涉及較為專業的知識,相互關系較為復雜,因此人們常常無意識地將相關性與因果關系混淆,從而導致感覺到悖論的出現。

既然相關性不等同于因果關系,那么到底什么是因果關系呢?人類對于因果關系的研究可以追溯到古希臘時期的亞里士多德,他討論了事物運動的原因,提出了“四因說”。但古希臘人所謂的“原因”觀念不同于近代以來的“因果性”觀念,他們所謂的“原因”與“為什么”相對應,并不與“結果”相對應。

一般認為,近代以來人們在哲學上關于因果關系的思考主要始于休謨。休謨認為,知識是通過感官獲得的印象而來的,印象產生觀念,觀念之間通過聯系而成為復合觀念。產生觀念之間聯系的性質共有三種:類似、時空接近和因果關系。也就是說,觀念之間經常因為類似、時空接近和因果關系而聯系起來,在這里,因果關系就是聯系觀念的橋梁。并且,“能夠引導我們超出記憶和感官的直接印象以外的對象間的唯一聯系或關系,就是因果關系,因為這是可以作為我們從一個對象推到另一個對象的正確推斷的基礎的唯一關系”,只有因果關系“才產生了那樣一種聯系,使我們由于一個對象的存在或活動而相信,在這以后或以前有任何其他的存在或活動”。也就是說,一個對象的存在或活動若是原因,在這之后就會有其他的存在或活動,若是結果,在這之前就有其他的存在或活動。因為一個對象的存在或活動而推導出其他的存在或活動的過程即可被視為推理(也稱為“推斷”)。在休謨的知識體系中,他提出“一切推理是比較和發現兩個或較多的對象之間的那些恒常或不恒常的關系”,而這種比較是感官所不能完成的。因果關系在知識表現上,就是一個對象的存在或活動與另一個對象的存在或活動之間的聯系,而在思維過程中表現的就是推理。在因果關系的概念上,休謨通過對原因和結果兩個對象的反復觀察,發現了因果關系的兩個特征:接近關系和接續關系。接近關系就是原因和結果在其發生的時間和地點兩方面都互相接近。當原因和結果看起來互相遠隔的時候,它們實際上也是被一連串互相接近的因果鏈條聯系起來的。接續關系就是在時間上,原因總是發生在結果之前。同時,休謨發現,“接近和接續并不足以使我們斷言任何兩個對象是因和果,除非我們覺察到,在若干例子中這兩種關系都是保持著的”“需要補充的這個關系就是它們的恒常結合”。對于因果關系的應用,休謨認為,“因果關系雖然是涵攝著接近、接續和恒常結合的一種哲學的關系,可是只有當它是一個自然的關系而在我們觀念之間產生了一種結合的時候,我們才能對它進行推理,或是根據它推得任何結論”。在休謨關于因果關系的概念中,原因和結果兩個存在或活動長期經常、相互接近、先后發生,但他并沒有強調原因的發生會引起結果的發生,顯然對相關性和因果關系的區分強調不夠。

在對近代以來西方哲學批判繼承的基礎上,馬克思主義哲學提出了現代意義的因果關系。馬克思主義哲學認為,“原因與結果是世界普遍聯系和永恒發展鏈條中的重要一環。人類的活動是有目的的活動,對事物因果聯系的認識是人類實踐活動的前提之一。可以說人類的科學認識就開始于對事物的因果關系的探索”。在馬克思主義哲學的理論體系中,因果關系是這樣定義的:“一種現象對于被它引起的現象來說是原因,對于引起它的現象來說就是結果。事物之間這種引起和被引起的關系就是因果關系。”在探索因果關系的過程中,“不能僅僅依據前件與后件的幾次重復出現便斷定前件是后件的原因,因為先出現的不一定是原因,后出現的不一定是結果,雖然原因與結果一般來說有先后的順序。人們在開始探索一種現象的原因時,往往要從在此之前的現象著手。先后多次甚至無數次出現,一般也能肯定其間的因果關系,但要最后肯定其間的因果關系,必須搞清楚原因引起結果的機制”。在馬克思主義哲學的因果關系定義中,重點強調了原因和結果之間引起與被引起的關系,并且明確指出,“最后肯定其間的因果關系,必須搞清楚原因引起結果的機制”,深刻揭示了因果關系應有的內涵。在前面關于火災傷亡人數和消防車數量之間統計關系的例子中,我們可以觀察到,出動“消防車數量多”的火災,“傷亡人數多”,但火災中“消防車數量多”并不會引起“傷亡人數多”,因此,根據馬克思主義哲學關于因果關系的概念,兩者之間只有相關性而沒有因果關系。與此相反,“太陽照射”和“石頭溫度升高”之間,“太陽照射”會引起“石頭溫度升高”,“石頭溫度升高”會被“太陽照射”引起,因此,根據馬克思主義哲學關于因果關系的概念,兩者之間具有因果關系。在馬克思主義哲學的因果關系概念中,通過對原因和結果之間引起與被引起關系的強調,對相關性和因果關系進行了明確、有效的區分。因此,本書將基于馬克思主義哲學的因果關系概念進行因果推斷相關內容的介紹。

主站蜘蛛池模板: 右玉县| 常山县| 马边| 朝阳区| 太湖县| 泌阳县| 嘉兴市| 江山市| 南京市| 顺平县| 伊宁市| 宁南县| 淄博市| 宣威市| 白水县| 绵阳市| 宜州市| 章丘市| 图木舒克市| 绿春县| 彭山县| 北京市| 信宜市| 丹阳市| 察隅县| 图们市| 中卫市| 巴林右旗| 南川市| 黄浦区| 郸城县| 志丹县| 虎林市| 仪陇县| 长丰县| 莱芜市| 子洲县| 阿拉尔市| 敦化市| 昭平县| 那坡县|