官术网_书友最值得收藏!

什么是囚徒困境

上中學的時候,我想當一名醫生。后來,我讀了《創世紀的第八天:20世紀分子生物學革命》(The Eighth Day of Creation: Makers of the Revolution in Biology),這本書的作者是《時代周刊》的專欄作家霍勒斯·賈德森(Horace Judson)。這部精彩的分子生物學編年史改變了我立志當醫生的理想。我當時便下定決心,要學習生命的化學本質,要研究那些構建細胞、為細胞提供動力并組織細胞運轉的分子,要去維也納大學學習生物化學。當時,并不是每個人都贊成我的決定。我的父母聽說他們唯一的孩子不再想當醫生,都很苦惱,因為他們認為醫生這個職業可以保障我順利成為受人尊敬的社會中堅。在他們看來,我要去學習的專業就是跟酵母有關,是用來對啤酒和葡萄酒進行發酵的。

1983年10月,我第一次進入大學的課堂,遇到了許多女孩,我從未見過那么多的女孩聚集在同一個地方。在藥理學專業的入學新生中,女性占了絕大多數,因此,跟我擠在一起同堂上課的600人之中,幾乎三分之二都是女孩。對于在男子中學度過青春期的我來說,大學簡直就是天堂。而在為數不多的化學專業學生里,有一個女孩名叫厄休拉(Ursula),她跟我一樣,也在拼命學習,努力跟上大學里深奧的數學課程。六年之后,我們結婚了。直到現在我還在懷疑,當初她挑上我,是否就是因為我的數學解題能力呢?

隨著我逐漸融入維也納大學的生活,我的學習重心也在不斷地調整。大一我喜歡物理學;大二我鐘愛物理化學;大三時,我有幸進入了彼得·舒斯特(Peter Schuster)的理論化學課堂。彼得可是這一領域里聲名遠播的人物,他是維也納大學生物數學學院的創始人,后來當上了奧地利科學院的院長,還曾給教皇本篤十六世講授過進化科學。剛一上彼得的課,我就立刻認識到,自己以后一定要跟這個人一同工作。到了大四,我開始在他的指導下,撰寫我的畢業論文。彼得為人熱情,涉獵甚廣,知識和興趣遠遠超出了科學的范疇。有一次,我們一起去登山,他說道:“只有裝備不足的登山者,沒有真正的壞天氣?!?/p>

我真正意識到自己完全迷上了數學,是在一年以后,我在阿爾卑斯山跟彼得一起徒步旅行的時候。那是1988年3月,我剛開始攻讀博士,就來到阿爾卑斯山靜修。跟我一同前往的是一群才華橫溢的年輕人,其中包括沃爾特·方塔納(Walter Fontana),如今他已成為哈佛醫學院的一名著名生物學家。我們的研究小組就住在奧地利群山中一個原始的小木屋里,一邊享受那里的新鮮空氣,一邊工作、游玩。我們滑雪,上課,暢飲啤酒和葡萄酒,我們思考生命的神秘。最棒的是,我們一起討論最新的理論和學術問題,有時是在溫暖的小屋里,有時是在阿爾卑斯寒冷的室外。在高高的山上,當許多想法脫口而出時,我們呼出的空氣都凝成了霧汽。我已經記不得,那究竟是我們對數學的夢想,還是熱氣變成的云霧,不過那種經歷真是太爽了。

我們這群熱情開朗的學生還接觸到了許多個性鮮明的學者,并從他們身上獲得了寶貴的知識。其中一位學者叫卡爾·西格蒙德,他是維也納大學的數學家。卡爾留著濃密而又凌亂的頭發和齊整的胡子,戴著眼鏡,看上去有點孤僻,不怎么平易近人。他很酷,更像是一名學生,而不是教授??杻H憑記憶就可以講授他所有的課程,用的是一種催眠式甚至咒語一般的語調和節奏。在那次令人心奮的阿爾卑斯靜修營的最后一天里,卡爾給我們講了一個他剛從報紙上看來的十分有趣的問題。

這篇文章是關于博弈論的。匈牙利裔的偉大數學家約翰·馮·諾依曼于1928年發表了他關于博弈論的第一篇論文,雖然在他之前也有別人提出過類似的概念,但多數歷史學家認為,馮·諾依曼才是開創這一領域并將其發揚光大的人。后來,曾遭到納粹迫害而來到美國避難的奧地利經濟學家奧斯卡·莫根施特恩(Oskar Morgenstern),也在這一領域作出了貢獻。在他的幫助下,馮·諾依曼對博弈論進行了完善,并成功地將其應用于經濟領域。利用博弈論的方法,馮·諾依曼對美蘇之間的冷戰行為進行了建模。他的這一方法廣為他人所用,比如著名的蘭德公司(RAND)。蘭德(研發)公司成立于1945年12月,是最早出現的智囊機構,最初是由美國空軍和國防承包商共同發起的一個RAND項目,目的是針對那些難以回答的問題找出答案。實際上,馮·諾依曼就是蘭德公司的一名顧問。

在演講中,卡爾向我們講述了對于“囚徒困境”的最新研究進展。囚徒困境是一個十分有趣的博弈,于1950年由梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)共同設計,這兩人恰恰就供職于加州圣莫尼卡的蘭德公司??枌Υ撕芨信d趣,設計這一博弈的發明者也意識到,作為一個強大的數學工具,囚徒困境很好地模擬了人類生活中最重要的一種斗爭——關于沖突與合作、個人利益與集體利益之間的斗爭。

這一難題之所以被命名為囚徒困境,是因為在它的經典形式中設計的是如下場景:假設你和你的同伙都已被警方捉拿歸案,囚禁起來,而且正面臨一項重罪控訴。檢方對你們倆分頭進行審訊,并各自提供一次選擇的機會。這個選擇機會正是囚徒困境的核心:如果某人充當背叛者,指控另一人的罪行,而與此同時,另一人保持沉默(不發起指控),那么背叛者坦白從寬,其刑期將減至1年,因為他揭發了同伙,使同伙獲罪;而保持沉默的同伙則將面臨4年的監禁。如果你們倆都保持沉默,相互合作,互不揭發,由于檢方控訴重罪的證據不足,你們的審判結果會相對較輕,將分別獲得兩年的刑期。還有一種結果是,你們倆都背叛對方,相互揭發,則都會被治以重罪,但考慮到都有坦白的表現,將分別處以3年的刑期。

在實際生活中,你可以發現從囚徒困境引申出來的無數變形,例如不同的環境、不同的懲罰和獎賞、不同的囚禁方式細節,等等。但無論形式如何變化,其中心思想都可以用一張選擇表——回報矩陣來表示(見表Y—1)。這個兩行兩列的矩陣可以概括囚徒困境的所有4種結果,也能概括日常生活中各種緊張微妙的局面。

表Y—1 回報矩陣

我們先看看回報矩陣的上面一行:你們倆都合作,每人獲刑兩年,記為-2,代表你們將失去自由的年頭。你合作,而同伙背叛,你獲刑4年,他獲刑1年。下面一行則描述了其他兩個可能的選項:你背叛,而同伙合作,你獲刑1年,他獲刑4年。你們倆都背叛,每人獲刑3年。從純粹自私的觀點來看,對你而言最好的結果是第三種情況,其次是第一種、第四種,而第二種情況是最差的。對你的同伙而言,第二種情況最好,然后分別是第一、第四和第三種情況。

假設你自己是一個理性而自私、事事爭第一的人,你會怎么做呢?你大概會這樣推理:你的同伙要么背叛,要么合作。如果他背叛,你也應該背叛,從而避免對你最壞的結果。如果他合作,你就應該背叛,從而獲得對你最有利的結果,獲刑最短。因此,無論你的同伙怎么做,你的最佳選擇都是背叛。

在回報矩陣所定義的這樣一種博弈里,背叛是一種優勢策略。在博弈論中,優勢策略的意思是說,無論對手采用何種策略,這個策略永遠是最佳的。這并不難理解:如果你們倆都合作,你獲刑兩年,但如果你此時改為背叛,則只需1年。如果對方背叛而你守口如瓶,你將獲刑4年,此時如果你改口背叛,則只需3年。因此,不管對方如何,你都最好采取背叛策略。

不過,在上述推理鏈條中存在一個漏洞。那就是你的同伙不是傻子,他跟你一樣,也在進行同樣的推理,也會得出同樣的結論。這樣導致的結果就是,你們兩人都背叛,各自入獄3年。這里的困境就在于,如果你們倆都采用對自己最佳、最理性的優勢策略,所獲得的結果還不如你們同時保持沉默!你們都得到了第三等的結果,但如果你們都合作的話,就可以獲得第二等的結果。

看起來是不是很無奈?這就是囚徒困境。只要你們相互信任、彼此合作,就能比自私自利獲得更好的結果。借助這一思考工具,我們可以更清晰地領會合作的意義:一方付出代價讓另一方獲利。在囚徒困境中,如果雙方都合作,就放棄了各自最優的結果——1年刑期,而獲得了次優的結果。但跟雙方都背叛相比,這仍然是一個不錯的選擇。

囚徒困境的形成,很大程度上取決于矩陣中合作與背叛所對應的利益安排。通過對各種選擇所對應回報價值的大小進行排列,可以對囚徒困境進行明確定義:R(Reward)是雙方都合作時所獲得的利益,S(Sucker)是一方合作、另一方背叛時合作方的損失,T(Temptation)是對方合作時己方背叛所獲得的好處,P(Punishment)是雙方背叛時得到的懲罰。我們來詳細討論這些概念。雙方合作的回報價值R明顯要高于雙方背叛的懲罰P。然而當一方合作、一方背叛時,背叛者獲得最高的回報T,而不幸的合作方則要接受最差的結果——傻子回報S??偟膩碚f,當TRPS時,就形成了囚徒困境。就這個基本博弈來說,我們也可以對各種回報以其他順序進行排列,從而得到不同的合作困境。但在所有這些困境之中,囚徒困境是最難解決的,你可以將其視為合作的終極困境。

在日常生活中,類似的困境總會以這樣那樣的形式發生在我們身上。當跟我競爭升職機會的同事休假時,我愿意幫他完成他分內的工作嗎?兩個互為競爭對手的公司各自定價時,是應該串通一氣以獲得最大的利潤,還是應該競相降價以搶奪市場?還有超級大國之間、鄰國之間,甚至不同物種之間的軍備競賽,都是囚徒困境的很好的例子。如果相互競爭的國家之間能夠達成合作,避免軍備競賽,這樣對大家都有好處。然而,對每一個國家來說,它們各自的優勢策略卻都是大幅加強本方的軍備。

主站蜘蛛池模板: 阜城县| 安岳县| 临西县| 昌都县| 平和县| 昌江| 吉安县| 汉寿县| 昌吉市| 涡阳县| 志丹县| 海城市| 林甸县| 根河市| 平阳县| 乐陵市| 叙永县| 伊春市| 明水县| 苍南县| 兴隆县| 黄浦区| 二连浩特市| 固镇县| 嵊州市| 哈巴河县| 彭山县| 泰宁县| 曲松县| 双峰县| 丰镇市| 石屏县| 伊金霍洛旗| 同心县| 嘉祥县| 张家港市| 庆城县| 青冈县| 平阳县| 乐平市| 信宜市|