- 邏輯學視野中的認知研究
- 任曉明等
- 9276字
- 2021-10-30 02:26:36
第一節 貝葉斯推理中的認知偏差
埃迪(Eddy, 1982)給出的乳腺癌問題,是貝葉斯推理研究中的一個經典問題。其表述如下:參加常規X光透視檢查的40歲婦女中,患乳腺癌的概率是1%。如果一個婦女患了乳腺癌,她的胸透片呈陽性的概率是80%。如果一個婦女沒有患乳腺癌,她的胸透片呈陽性的概率是9.6%。一個該年齡段的婦女,她的胸透片呈陽性,那么她實際患乳腺癌的概率有多少?[6]
以該問題為例,我們來考察貝葉斯算法過程所包含的策略思想。[7]

第一,弄清楚是什么樣的結果?如一個普通人檢測呈陽性。
第二,這個取樣來源于什么?如可能是患者,也可能不是患者。
第三,哪些原因導致這一結果?如可能這個人是患者而且檢測呈陽性,也可能這個人不是患者而且檢測也呈陽性。
第四,每個原因的權重是怎樣的?如前者的可能性是1% × 80%,后者是99% × 9.6%。
第五,在先知道結果的前提下,各原因的“作用”所占比例有多大?如一個取樣檢測呈陽性的前提下,他是患者的可能性是多大?
從上述貝葉斯推理問題的基本分析可以看出,貝葉斯推理的認知操作相當復雜,涉及概率的多種規則的運用,而且要經歷至少四步以上的推理過程,因此,單純依靠正確率或和標準值之間的差值來評價人們的貝葉斯推理顯得過于籠統和偏頗,無法深刻揭示貝葉斯推理過程中的認知加工機制和困難(錯誤)原因,也無法采取有針對性的措施來提高推理成績。
有的研究者從信息表征的角度探討過這些問題,如吉格倫澤和霍夫拉吉(Gigerenzer & Hoffrage, 1995)認為,信息的概率形式不適合人類大腦的加工方式,導致人在貝葉斯推理中常常出錯,如果采用自然頻數的形式表示概率信息,則可以提高貝葉斯推理成績。但也有研究者提出異議,認為他們在改變信息形式的同時也改變了其他變量(Lewis,Keren, 1999),其后也有研究者采用添加圖形來改變任務的信息表征以達到改善被試推理成績的目的(Yamagishi,2003;傅小蘭,趙曉東,2005;李曉明,傅小蘭等,2004)。然而,這些研究得出的結論是,“這些表征的改變雖然在一定程度上提高了貝葉斯推理成績,但仍有相當多的被試表現出顯著的高估或低估。顯然,改變表征方式并未從根本上探知以往研究的差異以及貝葉斯推理困難的原因”[8]。
有的研究者從實驗材料的角度探討了貝葉斯推理的認知加工機制,如張向陽等(2006)認為,貝葉斯推理過程中主體關聯性對貝葉斯推理概率估計存在影響;[9]而徐媛(2003)也提出,材料的選取對后驗概率的估計可能有影響。[10]但為什么研究材料的差異會導致研究結果的不一致呢?這表明人類的概率推理都存在什么樣的特點或偏差呢?
根據塞繆爾(Samuel, 2000)關于貝葉斯推理的定義可知,貝葉斯推理的算法實際上是一個獲取條件概率的過程。對不懂貝葉斯原理的人來說,要進行正確的后驗概率估計可能需要經過復雜的認知加工過程,因此,個體在認知加工過程中表現出的差異可能導致了估計結果的不同。有研究指出,人們進行貝葉斯推理時,主要的認知策略是“假設一個概率值—尋找證據—修改這個概率值”。這種策略也被稱為“錨定—調整”策略,即先依據題目中的某一個比例信息來假設一個概率值(錨定),然后依據一定的證據來修改這個概率值(調整)。[11]
貝葉斯推理過程涉及概率理論中的許多重要法則,而認知研究者關心的是,一個不懂貝葉斯推理規則的人對貝葉斯推理問題進行直觀概率判斷時,是否遵循貝葉斯推理規則。因此,關心貝葉斯推理認知基礎的學者認為,貝葉斯推理的研究要走過程和結果聯合評價的道路,“透過過程看本質”。如果僅僅將人們的估計值和貝葉斯公式計算的結果作比較來進行研究,可能會在一定程度上屏蔽人們解決貝葉斯推理問題的過程。[12]在這種研究范式下,通過對證據的認定和驗證性分析,可以發現,貝葉斯推理中主要的認知偏差有“錨定參照錯誤”、“直覺調整差誤”和“基礎概率忽略”等。
一 貝葉斯推理中的錨定參照錯誤
下面給出一組實驗,共2個案例(統稱為實驗1)。
實驗1.1:乳腺癌問題
測試1:“如果患乳腺癌的婦女在儀器檢測中有80%呈陽性。”那么,能否根據這句話來估計:“一個檢測呈陽性的婦女,她患癌的可能性有多大?”請選擇:
A.估計是80%左右;
B.可以估計,但不是80%左右;
C.很難估計。
測試2:某地區參加普查的婦女患乳腺癌比率為1%。這些患乳腺癌的婦女在儀器檢測中有80%呈陽性;沒有患乳腺癌的婦女在儀器檢測中有9.6%呈陽性。現在該地區普查時發現一位婦女檢測呈陽性,請你估計一下她患有乳腺癌的可能性有多大?請用百分數表示。
測試3:請敘述你給出這個估計的理由或者你是根據哪些信息得到這個估計的。(史滋福,2007: 75)
實驗1.2:中彩問題
測試1:“如果中獎的彩票有80%是從某銷售網點賣出去的。”那么,能否根據這句話來估計:“一張從這個銷售網店賣出去的彩票,其中獎的可能性有多大?”請選擇:
A.估計是80%左右;
B.可以估計,但不是80%左右;
C.很難估計。
測試2:某次彩票開獎的中獎率為1%。這些中獎的彩票有80%是從某彩票銷售網點賣出去的;那些沒有中獎的彩票有9.6%是從這個彩票銷售網點賣出去的。現在有一張參與本次開獎的彩票是從這個銷售網點賣出去的。請你估計一下,這張彩票中獎的可能性有多大?請用百分數表示。
測試3:請敘述你給出這個估計的理由或你是根據哪些信息得到這個估計的。[13]
在“乳腺癌問題”中,比較多的被試(60%)錯誤地將“擊中率”命題(患乳腺癌的婦女有80%檢測呈陽性)“換位表征”(即迷迷糊糊地認為,可以反過來說“檢測呈陽性的婦女有80%左右患乳腺癌”),從而在推理過程中表現出“錨定參照錯誤”(即錨定于80%,將其作為進一步調整的“參照”);在運用“虛報率”(沒有患乳腺癌的婦女有9.6%檢測呈陽性)信息對所錨定的“參照”進行調整的時候,被試并不依據“虛報率”信息(9.6%)和“虛報率”的“基礎概率”信息(99%),而是依據“虛報率”信息的“可得性啟發”(即心目中“沒有患癌而檢測呈陽性”的事例的多少)來處理,結果出現“直覺調整差誤”,只在80%的基礎上下降一點點(因為心目中“沒有患癌而檢測呈陽性的事例”是不多的),調整不到位。總之,多數被試采用了“錨定—調整”啟發式策略,并且由于“換位表征”導致“錨定參照錯誤”、由于“可得性啟發”導致“直覺調整差誤”,致使被試有偏差地整合任務中的概率信息,表現出普遍的高估(平均估計值77%),同時表現出了明顯的“基礎概率忽略”偏差。[14]
在“中彩問題”中,被試也采用“錨定—調整”啟發式策略,也同樣有上述兩個方面的偏向。但是,由于情境的差別,在該測試中,較少的被試(1%)對“擊中率”命題“換位表征”(將“中獎的彩票有80%是從某彩票銷售點賣出去的”換位表征“從某彩票銷售點賣出去的彩票有80%是中獎的”),而是錨定了“基礎概率”信息(彩票的中獎率為1%),同時依據“虛報率”信息的“可得性啟發”(即心目中“沒有中獎的彩票但是從這個銷售網店賣出去的事例”多少)來處理,結果也出現了“直覺調整差誤”,只在1%的基礎上上調了一點(因為心目中“沒有中獎的彩票但是從這個銷售點賣出去的事例”很多),調整不到位。因此,其后驗概率估計表現出了顯著低估,而不像“乳腺癌問題”中那樣表現出普遍高估(平均估計值為3.7%),同時“基礎概率忽略”偏差表現得沒有像“乳腺癌問題”中表現得那么明顯。[15]
乳腺癌問題和中彩問題,二者雖然在數學意義上講是完全同構的,但是人們對問題的解決卻表現出了顯著的差異。乳腺癌問題中更多的被試錨定擊中率信息,將“擊中率”命題“換位表征”,而中彩問題中更多的被試錨定“基礎概率”,依據“基礎概率”信息進行概率估計。這似乎說明,貝葉斯推理問題情境下存在“錨定參照錯誤”偏差,且不同任務情境下錨定的對象不同。就貝葉斯推理的準確性而言,無論哪種任務情境,將“擊中率”命題錯誤地“換位表征”的被試都普遍比其他被試高估(p<0.001),表現為“換位表征”被試的準確性最差。此外,從實驗結果來看,雖然“換位表征”被試的后驗概率估計值偏高,依據“基礎概率”信息的被試后驗概率估計值偏低,但和任務中提供的“擊中率”以及“基礎概率”信息相比,大部分被試的估計值都在“擊中率(80%)”和“基礎概率(1%)”的基礎上做了不同程度的調整(乳腺癌問題:M=76.80, M=3.21;中彩問題:M=76.16, M=1.68)。這似乎說明,貝葉斯任務推理過程中的錯誤,并非全部可以用“錨定參照錯誤”來解釋。絕大多數被試并沒有完全采用“擊中率”和“基礎比率”信息來代替后驗概率估計值,而是依據任務中的其他信息進行了調整,而且這種調整因任務情境而異。[16]
由此可知,人們在進行貝葉斯推理的時候,多數并不按照貝葉斯公式進行估算,而是采用啟發式(錨定—調整啟發策略)進行思考,其特點是簡便、快速但容易產生偏差。這種偏差叫作“錨定參照錯誤”,其產生的主要原因是“擊中率”命題的“換位表征”或過分關注“基礎概率”信息。“錨定參照錯誤”偏差對貝葉斯推理中后驗概率的估計存在影響。[17]
二 貝葉斯推理中的直覺調整差誤
實驗1的結果表明,不同推理任務中被試表現出的“錨定參照錯誤”偏差程度不同,對后驗概率估計準確性的影響也有差異。奧克福德(Oaksford, 2000, 2003)認為,日常生活經驗會影響人們對條件規則中前件、后件信息的概率估計,從而影響個體的推理行為。[18]那么,是否由于日常生活經驗影響了人們對貝葉斯推理問題解決中后驗概率的估計,從而表現出對任務情境的依賴性呢?貝葉斯推理問題解決過程中,日常生活經驗是如何影響后驗概率的估計的?(史滋福,2007: 28—29)下面以3個測試問題為例(統稱為實驗2)。
實驗2.1:研發部問題
某工廠有1%的高學歷員工(大學畢業以上)。據統計,該廠高學歷員工有80%的在研發部工作,低學歷員工有9.6%在研發部工作。
測試問題1:李明是研發部的員工,他是高學歷的可能性多大?請用百分數表述。
測試問題2:請說明你給出這個估計的理由或根據哪些信息得到這個估計的。
測試問題3:根據你的日常生活經驗,你認為研發部里低學歷員工的比率有多大?請用百分數表示。[19]
實驗2.2.機關辦公室問題
某工廠有1%的高學歷員工(大學畢業以上)。據統計,該廠高學歷員工有80%的在機關辦公室工作,低學歷員工有9.6%在機關辦公室工作。
測試問題1:李明是機關辦公室的員工,他是高學歷的可能性多大?請用百分數表示。
測試問題2:請說明你給出這個估計的理由或根據哪些信息得到這個估計的。
測試問題3:根據你的日常生活經驗,你認為機關辦公室里低學歷員工的比率有多大?請用百分數表示。[20]
實驗2.3:模具車間問題
某工廠有1%的高學歷員工(大學畢業以上)。據統計,該廠高學歷員工有80%的在模具車間工作,低學歷員工有9.6%在模具車間工作。
測試問題1:李明是模具車間的員工,他是高學歷的可能性有多大?請用百分數表示。
測試問題2:請說明你給出這個估計的理由或根據哪些信息得到這個估計的。
測試問題3:根據你的日常生活經驗,你認為模具車間里低學歷員工的比率有多大?請用百分數表示。(史滋福,2007: 76)
實驗2的三個實驗考察了日常生活經驗對貝葉斯推理的影響。從數學結構(數量關系)來看,這三種貝葉斯推理問題解決的任務完全同型,因此,問題情境的變換并不會影響其答案的唯一性。但實驗結果卻表明,任務情境主效應顯著(p<0.05),這似乎說明,人們面對貝葉斯推理問題時,并不是嚴格按照貝葉斯推理規則進行推理的,而是采取一些啟發法,如“可得性啟發策略”來做出直觀判斷,從而導致“直覺調整差誤”,得到一些有偏差的概率估計。[21]
從實驗2的結果發現,人們對貝葉斯推理問題解決的后驗概率估計值和對任務情境中“虛報率”信息“可得性”測量中的主觀概率之間,存在顯著的負相關(r= -0.467, p<0.01)。這似乎說明,日常生活經驗會影響人們對貝葉斯推理問題解決中的概率判斷,同時也在一定程度上佐證了奧克福德等人把概率理論應用于推理研究中的意義和價值。在人類推理過程中,日常生活中體驗到的事件發生的概率,可以比形式邏輯更有效地解釋人類推理的內部心理機制。[22]
這也可以在一定程度上解釋“內容效應”。比如,對于“疾病問題”,根據日常生活經驗,人們認為X光透視結果為陽性的人沒有患癌癥的可能性不大(可得性程度低),因此,對“如果一個人檢測呈陽性,則他患癌癥的可能性”的估計值就會很高。(史滋福,2007: 31)
通過上述三個與“乳腺癌問題”同型的“研發部問題”“機關辦公室問題”和“模具車間問題”的研究,可以發現,(1)“可得性”啟發與后驗概率估計計算過程中表現出的“直覺調整差誤”偏向密切相關;(2)學科性質在后驗概率估計中沒有差異。[23]
三 貝葉斯推理中的基礎概率忽略問題
特沃斯基和凱勒(Tversky & Kahneman, 1971)曾用“啟發式理論”來解釋不確定情況下人類思維不符合邏輯規則的原因。這些原因包括僅適用較少的幾個啟發式策略發現有價值的信息、進行相對簡單的判斷和估計。例如,他們用代表性啟發式策略來解釋貝葉斯推理問題中的估計偏差,認為乳腺癌問題中“擊中率”傳達了儀器檢查呈陽性的婦女患乳腺癌的概率估計值接近“擊中率”的信息,因此,在推理過程中忽視“基礎概率”信息,得到高估的概率值(Kahneman, 1972, 1982)。但大量研究表明,人們還是關注了任務中的各個信息(如“基礎概率”),只是沒有足夠重視(Koehler, 1996; Evans, 2002;張向陽,2003)。實驗1的結果表明,在某些任務情境中,如“中彩問題”中,更多的被試會過分關注“基礎概率”信息,而不是忽視。從實驗2來看,三種問題情境的數學結構相同,但貝葉斯推理問題解決的結果卻存在顯著差異,除了表現出日常生活經驗對推理的影響之外,是否也存在任務情境的不同,基礎概率重視程度存在差異的情況呢?[24]
由于貝葉斯推理問題解決涉及多種復雜的算法,為進一步了解偏差產生的原因,在考察貝葉斯推理問題解決的推理過程中是否存在“基礎概率忽略”偏差以及這一偏差是否表現出一定的內容效應時,史滋福(2007)設置了實驗3,使用兩種貝葉斯推理任務(乳腺癌問題和中彩問題的變體),并采用過程與結果雙重評價方式:在線推理過程記錄(理由敘述)與推理分解、后驗概率估計值,并對記錄和推理分解結果、估計值分別進行分析。此外,為考察“基礎概率忽略”在解決簡單的日常生活問題時是否也普遍存在,以及解決日常生活問題與貝葉斯推理問題解決時表現出的“基礎概率忽略”是否有一定的聯系,該實驗材料中還設置了兩道日常生活問題(小學生題和衛校學生題)。[25]
實驗3.1:乳腺癌問題變體
1.題干:某小學五年級學生進行體能測試,結果:男生達標率90%,女士達標率60%。
測試問題1:請估計這個年級體能達標率,選擇
A.80%—90%
B.70%—80%
C.60%—70%
D.無法估計
2.題干:某衛生學校護士班進行體能測試,結果:男生達標率90%,女生達標率60%。
測試問題2:請估計這個班體能達標率,選擇:
A.80%—90%
B.70%—80%
C.60%—70%
D.無法估計
3.題干:某地區參加普查的婦女患乳腺癌比例為1%。這些患乳腺癌的婦女在儀器檢測中有80%呈陽性;沒有患乳腺癌的婦女在儀器檢測中有9.6%呈陽性。
測試問題3:現在該地區普查時發現一位婦女檢測呈陽性,請你估計一下她確實患乳腺癌的可能性有多大?請用百分數表示。
測試問題4:請敘述你給出這個估計的理由或根據哪些信息得到這個估計的。
測試問題5:請估計該地區婦女“患乳腺癌且檢測呈陽性”與“沒有患乳腺癌但檢測呈陽性”兩種可能性的比例是多大?請用比例形式給出數字估計。
測試問題6:請估計該地區“患乳腺癌且檢測呈陽性”的婦女在該地區婦女中所占的比例有多大?請用百分數表示。
測試問題7:請估計該地區“沒有患乳腺癌但檢測呈陽性”的婦女在該地區婦女中所占的比例有多大?請用百分數表示。[26]
實驗3.2:中彩問題變體
1.題干:某小學五年級學生進行體能測試,結果:男生達標率90%,女生達標率60%。
測試問題1:請估計這個年級體能達標率。選擇:
A.80%—90%
B.70%—80%
C.60%—70%
D.無法估計
2.題干:某衛生學校護士班進行體能測試,結果:男生達標率90%,女生達標率60%。
測試問題2:請估計這個班體能達標率,選擇:
A.80%—90%
B.70%—80%
C.60%—70%
D.無法估計
3.題干:某次彩票開獎的命中率是1%。這些中獎的彩票有80%是從某彩票銷售網點賣出去的;那些沒有中獎的彩票有9.6%是從這個彩票銷售網點賣出去的。
測試問題3:現在有一張參與本次開獎的彩票是從這個銷售網點賣出去的,請你估計一下,這張彩票中獎的可能性有多大?請用百分數表示。
測試問題4:請敘述你給出這個估計的理由或你是根據哪些信息得到這個估計的。
測試問題5:請估計這張開獎的彩票“中獎且是從這個銷售網點買的彩票”與“沒有中獎但也是從這個銷售網點買的”兩種可能性的比例是多大?請用比例形式給出數字估計。
測試問題6:請估計這張開獎“中獎且是從這個銷售網點買的彩票”占這個銷售網點賣出彩票的比例有多大?請用百分數表示。
測試問題7:請估計這張開獎“沒有中獎但也是從這個銷售網點買的彩票”占這個銷售網點賣出彩票的比例有多大?請用百分數表示。[27]
在上述兩個問題的測試中,被試分為了“基礎概率忽略組”和“基礎概率考慮組”。實驗結果表明,兩組被試在兩種任務情境下,任務情境主效應在統計上不顯著(F(1, 112)=0.354, P>0.05),而被試類型主效應在統計上極其顯著(F(1, 112)=131.725, P<0.001),任務情境和被試類型的交互作用也不顯著(F(1, 112)=0.004, P>0.05)。[28]
對“基礎概率忽略組”和“基礎概率考慮組”的被試人次進行卡方檢驗,結果表明,二者差異不顯著(x2=0.862, P>0.05)。這似乎說明,解決日常問題的過程中,許多被試都表現出了基礎概率忽略,并且和考慮基礎概率的被試人數相當。進一步考慮兩組被試文理科的人數分布,發現“基礎概率考慮組”中文科學生21人,理科學生32人,“基礎概率忽略組”中文科學生35人,理科學生28人。卡方檢驗的結果也表明,它們的差異不顯著(p>0.05),說明解決日常問題的過程中,文理科學生在基礎概率忽略現象上沒有表現出差別。但有趣的是,兩題選擇B、C的被試人數(47)遠遠多于選擇A和D的人數(17),所以,人們在思考問題時,并不嚴格按照數學思維,而是不自覺地使用了日常生活經驗。這與實驗2的結果是一致的。[29]
實驗結果也表明,在乳腺癌問題變體中,“基礎概率忽略組”和“基礎概率考慮組”的人次沒有差異(x2=0.158, p>0.05),而中彩問題變體中“基礎概率忽略組”與“基礎概率考慮組”的人次差異達到了顯著的水平(x2=16.288, p<0.001),這似乎表明,問題情境不同表現出的偏差程度也不一樣(史滋福,2007: 35)。一個有趣的現象是,在乳腺癌問題中,被試傾向于計算,而在中彩問題中則傾向于直覺判斷。這似乎說明,人們對抽象的不熟悉的問題習慣于套用數學邏輯,表現得要理性一些,而對生活情境化的問題,可能更多地依靠直覺,習慣于使用生活邏輯進行判斷。而所表現出的中彩問題推理準確度高于乳腺癌問題中的推理準確性,可能是因為在中彩問題中人們根據直覺得出的結論更接近于標準值(史滋福,2007: 36)。
實驗3還表明,在面對簡單的日常生活問題情境和復雜的貝葉斯推理任務時,同樣的被試也可能會表現出對基礎概率不同程度的關注(史滋福,2007:35)。但無論是在日常生活情境中,還是在貝葉斯推理情境中,都存在“基礎概率忽略”現象,只是二者在統計上沒有關系(史滋福,2007: 60—61)。
通過乳腺癌問題變體以及與之同型的中彩問題變體兩個案例,使用過程與結果雙重評價方式,對在線推理過程記錄(理由敘述)與推理分解、后驗概率估計值分別進行分析的結果表明:(1)解決日常生活問題與貝葉斯推理問題解決中均存在“基礎概率忽略”偏差,但二者沒有關系。(2)貝葉斯推理問題解決中存在的“基礎概率忽略”偏差程度與推理任務有關,對推理成績有影響。[30]
四 貝葉斯推理中的認知偏差及其啟示
人們在貝葉斯推理過程中并不是單純依賴經驗的判斷或猜測,而是在經驗的基礎上采用“錨定—調整”啟發式對任務中各種信息進行了整合。由于貝葉斯推理任務相當復雜,其任務難度超過了人們信息加工的認知負荷,使其不能清晰表征復雜的概率問題,從而外顯為隨任務情境而變的一些認知偏差,如“錨定參照錯誤”、“直覺調整差誤”和“基礎概率忽略”等,致使被試有偏差地整合任務中的概率信息,表現出后驗概率估計顯著高估或低估。王甦等(1992)也認為,在概率數值上表現出來的保守或錯誤,可能是對概率的判斷或諸概率的組合不夠精確之故。有關認知負荷和注意的研究也早已發現,人們在解決復雜問題的時候,由于同時要進行多種心理活動,所以會出現認知資源嚴重不足,導致一些偏差的產生(Sweller, 1988;張清芳等,2000),這似乎也支持本研究的假設,即貝葉斯推理問題解決過程中所出現的各種認知偏差導致了推理困難。[31]
研究結果還表明,不同的貝葉斯推理任務中所表現出的偏差的性質和程度不同,對后驗概率估計準確性的影響也有明顯差異。這似乎可以解釋,不同研究者之所以得到截然相反的結論,可能是因為他們使用的推理任務不同導致了不同的偏差程度,從而對推理過程產生了不同程度的影響。如凱尼曼(Kahneman)等使用的“出租車問題”和愛德華茲(Edwards)使用的“乳腺癌問題”容易導致高程度的“錨定參照錯誤”和“直覺調整差誤”偏差,而彼得森(Peterson等,1967)使用的“摸球問題”則不然。另外,在“乳腺癌問題”中容易將“擊中率”命題(患乳腺癌的婦女有80%檢測呈陽性)“換位表征”(檢測呈陽性的婦女有80%左右患乳腺癌),而在“中彩問題”中“錨定基礎概率”信息,從而在推理過程中表現出“錨定參照錯誤”(錨定于1%),并將其作為進一步調整的“參照”;在運用“虛報率”信息(如“沒有患乳腺癌的婦女有9.6%檢測呈陽性”或“沒有中獎的彩票有9.6%是從這個銷售網點賣出去的”)對所錨定的“參照”進行調整時,被試并不依據“虛報率”信息(9.6%)和“虛報率”的“基礎概率”信息(99%),而是依據“可得性啟發”(“沒有患癌而檢測呈陽性的事例的多少”或“沒有中獎但從這個銷售網點賣出去的事例的多少”)來處理,結果出現“直覺調整差誤”,只在80%(或1%)的基礎上下調整一點點(因為心目中“沒有患癌而檢測呈陽性的事例”不多或“沒有中獎但是從這個銷售網點賣出去的事例”很多),調整不到位。總之,在上述實驗條件下,被試采用“錨定—調整”啟發式策略,并且“換位表征”和“錨定基礎概率”導致“錨定參照錯誤”、“可得性啟發”與“直覺調整差誤”密切相關(史滋福,2007: 37—38)。
綜上所述,人們在貝葉斯推理的過程中并不單純依賴經驗的判斷或猜測,而是在經驗的基礎上采用“錨定—調整”啟發式對任務中各信息進行了整合。具體地,被試采用“錨定—調整”啟發式策略,并且“換位表征”和“錨定基礎概率”導致“錨定參照錯誤”偏差,“可得性啟發”與“直覺調整差誤”偏差密切相關,同時在整合的過程中存在“基礎概率忽略”的偏差,這三種偏差致使被試有偏差地整合任務中的概率信息,表現出對后驗概率估計顯著地高估或低估,因而對貝葉斯任務的推理成績都有影響。[32]
上述研究結果表明,導致貝葉斯推理困難的原因是多方面的,它并不單純反映了人們推理形式方面的缺陷,而且還揭示了人們日常生活經驗以及任務情境對概率判斷的影響。這也似乎提醒我們,推理者進行推理加工時所依賴的知識結構可以分為推理形式知識和推理內容知識兩個方面,推理者既可以按形式標準來判斷推理結果,也可以按內容標準來判定推理結果。[33]對貝葉斯推理問題的深入討論,對于認識人們在貝葉斯推理中的常犯錯誤,從而達到學習概率思維技巧和提高貝葉斯推理問題解決能力的目的提供了認知依據,同時也對考察人類能否正確進行貝葉斯推理,以及了解貝葉斯推理中人類的心理機制具有重要意義。