第5章 囚徒困境:善于合作才能贏(2)
- 20幾歲學點博弈論(每天學一點時尚閱讀書系列)
- 墨墨
- 3471字
- 2016-01-05 16:47:58
這其實是事先設計好的一種博弈“困境”。如果選2,每個學生所得到的錢都比選1的學生得到的錢多50美分,這個假設也是有現實意義的,因為生產假冒的產品本身要比生產真正的產品獲利多。只不過,選2的人越多,他們的總利潤就會越少,這個假設同樣是有現實意義的,因為假貨越多,其產品的信譽就會越低,所以他們贏利就會越少。
現在假設27名學生都選擇1,那么他們每個人都將得到108美元;如果其中一個人偷偷選擇了2,背叛了別人,改變了決定,那么選擇1的人就剩下26個,而他們將比27人都選擇1少得到4美分,也就是拿到104美元,可是那個背叛者卻會拿到154美元,它拿的比27人都選擇1多出46美分。
事實上,無論開始選擇1的人有多少,其結果都是一樣的,因為選擇2是一種優勢策略,每個選擇2的人都會多拿46美分,而他的舉動會讓其余26個人每人少得到4美分,所以全班的總收入會少58美分。如果這27個人中,每個人都選擇了這種優勢策略,以讓自己的收益達到最大化,那么他們將各得到50美分。可是,他們如果達到一種合作的協議,暫時把個人的收益減少到最小,那么他們將在最后得到108美元。身為局外人的你會怎么選擇呢?
在這個選擇開始之前,教授提出的規則是不允許學生在一起討論,以防他們“狼狽為奸”,但是給他們很長的選擇的時間,所以他們還是“合謀”了,在達到利益最大化的協議時,有大約14個人同意選擇1,可是最終的結果是只有4名學生選擇了1,因此,27個人的總收益是1582美元,比大家合作少1334美元?!昂现\”的領導者說:“以后我再也不會相信哪個人了!”但是你可知道這些同學為什么選擇2?
“囚徒困境”為人們探討合作是怎樣形成的提供了非常形象的說明,同時也為合作產生的不良結局做出解釋,因為每個人都會從自己的角度去思考問題,這正是合作沒有達到利益最大化的原因。在“零和博弈”中提到的雙贏設想就是因為存在“囚徒困境”這個問題所以才無法實現。
“囚徒困境”可以說是無孔不入的,它存在于生活的各個角落,連政治高手們也會變成困境中的囚徒。
1984年,很多人都清楚美國聯邦預算赤字的確是高得有些過分了。裁減必需的巨額開支在政治上也是可以實行的,所以,大幅增稅應該說是不能逃避的問題??墒牵瑳]有人愿意擔任政治領導這個角色,誰都不想帶頭主張這么做。曾經有一位叫沃爾特·蒙代爾的民主黨總統候選人在自己參加競選時,想用這個政策的轉變為自己制造聲勢,卻被羅納德·里根打得落花流水。因為里根曾許諾過不加稅,在里根當選以后,這個問題就陷入了僵局,不管如何劃分政治派別,是共和黨還是民主黨,是參議院還是眾議院,他們都希望把提出加稅方案的主動權推到對方頭上。
他們都明白,如果雙方聯合起來,一起提議削減開支和加稅,能夠一起分享榮譽、分擔責任。這么做和同時被動堅守、眼看著巨額赤字上升而自己無動于衷比起來,顯然是對國家有利的,就算是對他們個人的政治生涯來說,他們也會從中得到一些好處。而反過來,如果是自己先提出這種策略,對方卻堅守被動,且不附和自己,那么自己就會受到一定的打擊。從各種角度看,最好的結果都是對方提出削減開支和加稅政策,巨大的政治代價由對方去付,自己只享受利益。
現在可以把這種情況看成是一種博弈。共和黨和民主黨是博弈的雙方,為了表示誰更傾向于現有的政策,非常明顯,對他們中的任何一方來說,保持被動都是一種優勢策略。正是這種態度導致了一種真實發生的“囚徒困境”:這一屆國會沒有制定任何加稅政策。這也是美國為什么是世界上最強大、最富有的國家,同時也是最大債務國的原因。
當個人的利益和集體的利益發生沖突時,每個人都想追求自己的利益,因此導致了一個對所有人都不利的結局,這也是博弈論中著名的“納什均衡”。而“囚徒困境”的最差結局正是一種“納什均衡”。
只有當人們都愿意替對方著想時或者雙方經過“合謀”時,才可能得到對雙方來說都是最好的結果,也就是所謂的雙贏。但想達到這種結果是很難的,雖然合作的確是比背叛更有利的“利己策略”,可是它卻有一個前提——人人都可以做到,人與人之間的不信任讓這個前提幾乎成為一種幻想。
“囚徒困境”滲入人類的各個角落,這種理論已經深入到社會的方方面面,無論是國際政治、軍事經濟以及文化領域,都是猜疑多于信任的,非合作的情況比合作的情況更為常見。現在社會上很流行“博弈”這個詞,我們的每種舉動似乎都處在博弈之中,所以“囚徒困境”作為博弈的一種還將繼續困擾著我們。
“爾虞我詐”,終成“偷雞不成蝕把米”
2002年到2005年間,美國有一個競賽表演節目叫“是敵是友”,它是在競賽表演廣播網放映的,這是一個以真人形式進行“囚徒困境”博弈的節目,只不過情景是人為的。
這個競賽中會選出3對合作者參與競賽。在每對合作者被淘汰出局時,他們就會產生一種“囚徒困境”的博弈,因為他們要決定怎樣分配他們的獎品。
假如他們都選擇合作,那么獎品將被平均分配。假如其中一個人背叛了,那么合作的人將什么都得不到,而背叛者將會得到所有的獎品。假如兩個人同時背叛了,那么他們將一無所獲。
需要注意的是,這個支付矩陣和標準的“囚徒困境”并不相同,這里“對手背叛、我合作”“同時背叛”,對個人來說損失是相同的。與標準的“囚徒困境”穩定均衡相比,“都背叛”是不穩固的均衡。假如你知道對手會背叛你,這時你無論怎樣選擇都沒辦法影響你的獎品。
這個支付矩陣為:假如雙方都合作了,每人都將得到1;兩個人同時背叛,兩個人都會得到0;假如A背叛而B合作,A得到2,而B得到0。
當然,“是敵是友”參賽者只能進行一次博弈,它并不適合重復博弈的觀點,所以對方根本沒辦法“以牙還牙”。在這個節目中,每位參賽者都可以做一個聲明,讓另一個人在雙方均不知道對方背叛與否前,確信他是對方的朋友。
然而,事實證明,知不知道對方的策略對“囚徒困境”似乎是沒有影響的。因為即使提前知道對方的策略,“背叛”依然是最好的選擇,無論他獲知對方選擇朋友還是敵人都一樣,大不了雙方都空手而歸。
其實,“囚徒困境”中的囚徒假如堅持彼此合作,是可以為雙方贏來最佳利益的,可是在資訊不明的情況下,他們知道出賣合作者能為自己帶來利益,也知道合作者出賣他們能為自己帶去利益,所以最后他們彼此出賣了。
這種現象在生活中很常見,也就是說在一個集體中,也許每個人的選擇都是理性的,可是對整個團隊來說卻是不理性的。
其實,在股市中“博弈”的人也是處于一種“囚徒困境”里。對博弈雙方來說,在股市漲到最高點時,無論是對企業還是對散戶來說,哪一方的最大利益都是“我賣,你沒賣,所以我獲利了”,然而他們的最理想狀態卻是“一起選擇不賣,以便把股市推到一個更高的點上,這樣每個人就都有更大的利潤空間”??烧嬲慕Y果卻是大相徑庭的,雖然人人都明白其中的道理。可見“囚徒困境”在這個事件中起到了關鍵性的作用。
人們都明白合作是最理想化的擺脫困境的策略,可是假如當出賣別人可以換得自己的平安時,出于本能,人們是會趨利避害的。
有位技藝高超的捕鳥師,一天下午,他和徒弟一同出門捕鳥。師徒二人在沙灘邊悄悄地把網張開,撒下了許多食物,之后他們就躲進蘆葦叢里,安靜地等著鳥兒自投羅網。
食物的香味很快就把鳥兒引來了。剛到的鳥兒聒噪地呼朋引伴,沒一會兒,就有成群的鳥兒拍打著蓬松的翅膀,一齊向這邊飛過來。
也許這些鳥兒真的餓壞了,它們一落下就狠狠地啄食,保持警覺的它們也不忘在吃東西的時候向四處亂看。正當這些鳥兒為饑餓時能找到這樣美味的食物而慶幸的時候,捕鳥師突然一拉繩子,“呼啦”一聲,沒等這些平時一有風吹草動就迅速飛走的鳥兒張開翅膀,就把它們全罩在網里了。捕鳥師和徒弟馬上跑過去想按住網,可是這個大網居然騰空飛起。原來,網里有一只很大的鳥,它先張開翅膀向上飛,其他的鳥見了,也跟著努力拍翅膀,于是,鳥兒帶著網一起飛了起來。
平日里“老死不相往來”的鳥兒居然在生死存亡之際合作起來。徒弟感到無望了,可是捕鳥師抬頭看了看快要落山的太陽,又看了一眼飛起的大網,對徒弟說:“這些鳥兒飛不遠了,我們快跟上去?!蓖降苡X得很納悶,但還是按照師傅的話做了。他們跟著鳥跑了半個小時,還沒追上那張網,其他人都說他們是傻瓜,可是捕鳥師對此卻毫不理會,依然全力追網。
就在太陽將要落山時,網突然整個掉了下來。捕鳥師立刻撲上去,把鳥兒們全部抓住了。徒弟感覺很奇怪,問:“你怎么知道網會落下來?”
捕鳥師回答:“每當夜幕降臨時,這些鳥兒都將回巢,他們來自不同的地方,于是有的往南飛,有的往北飛。它們為了各自的利益,鬧成一團,不再像起初那樣齊心協力了,所以網就掉落下來?!?/p>