官术网_书友最值得收藏!

第1節:囚徒困境

要點

在被稱為“囚徒困境”的一對一單次同時博弈(單階段同時兩人博弈)之中,如果各參與者都選擇占優策略,就會導致比合作更壞的結果。但在現實的商業活動之中,為了自身的利益而出賣對方的情況十分常見。即便是同時博弈,也存在沒有占優策略的情況。

案例

一、案例1:X汽車選擇技術開發委托方

歐洲大型汽車生產企業X汽車打算委托其他企業開發一種安全裝置?,F在候選企業有安德森公司、布什公司、庫克公司和戴爾公司四家。最終采用的安全裝置技術肯定是在安德森公司的安德森方式和布什公司的布什方式之中二選一。

但在X汽車看來,不管是安德森公司還是布什公司,其資金和技術都不足以單獨完成開發。因此還需要至少一家企業加入開發中來。而這個補充企業的候選就是庫克公司和戴爾公司。這兩家企業都擁有一定的資金和技術實力,完全能夠彌補安德森公司和布什公司的不足之處。

安德森公司表示將在這項技術的開發上投入20億日元的經費,布什公司則表示將投資30億日元。X汽車向庫克公司和戴爾公司咨詢后得知,這兩家企業都準備了15億日元的開發資金。從技術難度和這四家企業的綜合實力來看,他們的投資額都不會再發生太大的變化。

安德森方式和布什方式在技術上難分伯仲,而且完成開發所需的資金規?;鞠嗤?。產品化后所需的制造成本也不相上下。因此,X汽車希望庫克公司和戴爾公司進行一場“投票”,最終選擇合計投資額最多的一方。

庫克公司和戴爾公司需要在限定期限之內告訴X汽車自己究竟是支持安德森方式還是支持布什方式。至于庫克公司和戴爾公司是各自做出決定還是事先商量之后再做出決定,X汽車不予追究。根據上述規則,可能出現如下的情況。

兩家公司都支持安德森方式、X汽車采用安德森方式。

安德森方式合計50億日元VS布什方式合計30億日元。

兩家公司都支持布什方式、X汽車采用布什方式。

安德森方式合計20億日元VS布什方式合計60億日元。

庫克公司支持安德森方式、戴爾公司支持布什方式、X汽車采用布什方式。

安德森方式合計35億日元VS布什方式合計45億日元。

庫克公司支持布什方式、戴爾公司支持安德森方式、X汽車采用布什方式。

安德森方式合計35億日元VS布什方式合計45億日元。

不管采用哪種方式,將來通過該技術獲得的收益,都按照開發投資額,也就是各企業投入的開發資金所占的比例進行分配。

X汽車將上述信息全都傳達給了庫克公司和戴爾公司。

* * *

距離給X汽車答復的最終期限還有不到一個星期,但庫克公司的董事長庫克還是遲遲無法做出選擇。安德森公司和布什公司都對庫克發起了猛烈攻勢,雙方都明確表示“只要你選擇我們公司,必將給你最大限度的回報”。

庫克公司最重要的課題是要選擇能夠被X汽車采用的技術,同時也要盡可能使自己獲得更多的收益。

最理想的情況是庫克公司支持布什方式而戴爾公司支持安德森方式。在這種情況下,庫克公司的投資額占三分之一(45億日元中的15億日元),能夠獲得最多的收益。反之,如果庫克公司支持安德森方式而戴爾公司支持布什方式,那么庫克公司將一無所得。

對X汽車提供的資料進行分析后可知,不管采用安德森公司還是布什公司的安全裝置技術,該項目的總凈現值固定為150億日元。因此,在前者的情況下庫克公司能夠得到50億日元(=150÷3)的收益,而后者的情況則為零。

庫克公司和戴爾公司都支持相同方式的情況下,選擇安德森方式和選擇布什方式所能夠獲得的收益也是不同的。兩家公司都支持安德森方式的話,庫克公司的投資為50億日元中的15億日元。兩家公司都支持布什方式的話,庫克公司投資則為60億日元中的15億日元。也就是說,在前者的情況下,庫克公司能夠獲得45億日元的收益,后者的情況下則只能獲得37.5億日元的收益。很顯然,如果兩家公司都支持相同的方式,選擇兩家所占投資比重大的方式最為有利。

庫克在思考這個問題的時候,嘗試將所有的情況都整理出來,最后得出圖表1-1。

圖表1-1 庫克整理的情況

通過這個圖表可以看出,庫克不僅考慮了自身的情況,還將戴爾公司的情況也考慮了進來。比如庫克公司支持布什方式,而戴爾公司支持安德森方式的話,那么庫克公司將獲得最多的收益50億日元,而戴爾公司則一無所獲。因為庫克公司和戴爾公司的投資額剛好相同,所以圖標呈對稱的形式。

令庫克感到煩惱的是,最終的結果很有可能是情況4。從庫克公司所能夠獲得的收益來看,這是排在第三位的選擇。如果能夠與戴爾公司共同合作,那么就應該以實現情況1為目標,共同支持安德森方式。但若采用這一策略,戴爾公司遵守約定的話當然皆大歡喜,萬一戴爾公司臨時改變了主意,那么就會出現最壞的情況(從情況1變成情況2)。當然,對于庫克公司來說,背叛戴爾公司選擇支持布什方式的誘惑(從情況1變成情況3)也令人非常難以拒絕。

最終,庫克認為選擇支持布什方式是最沒有風險的明智決定。大概戴爾公司也是這樣想的吧。當然,因為害怕遭到背叛而眼睜睜地看著7.5億日元(=45-37.5)白白溜走,也實在是讓人心有不甘。所以庫克的腦海中有那么一瞬間也閃過了“對方背叛的概率有多少”的想法,但遭到背叛的話所要付出的代價實在是太大,還是應該盡可能避免這樣的情況發生。

就在這個時候,庫克辦公桌上的電話響了起來。是戴爾公司的董事長戴爾打來的。戴爾開門見山地說道。

“庫克先生,這次我們一起支持安德森方式吧。關鍵在于我們要通力合作。想必庫克先生也很清楚,一起支持安德森方式對我們雙方來說都有利?!?/p>

“但是,我怎么知道你肯定不會背叛我呢。在這種情況下我怎么能接受你的提議?”

“要這么說的話,我也一樣。如果你不遵守約定的話我也會很被動。而且就算我們兩人之間簽訂了協議,也不具備任何法律效力,我們只能相信彼此?!?/p>

“雖然我也很想信任你,但還是怕有‘萬一’啊?!?/p>

“在這個行業,信用不是擺在第一位的嗎。我們誰都不想被貼上‘背叛者’的標簽吧。說不定以后還有合作的機會呢?!?/p>

“你說的沒錯,但眼下最重要的是這個項目。將來的事情誰知道呢。”

“看來我是說服不了你了。希望你能夠再考慮考慮,如果你不想眼睜睜地看著幾億日元白白溜走,就給我打電話。好不容易有個大賺一筆的機會,錯過了豈不是很可惜?!?/p>

放下電話后,庫克陷入了深深的思考。

“戴爾先生的葫蘆里究竟賣的是什么藥。他說的是真心話嗎,還是故意迷惑我?他應該也知道最壞的情況是什么?!?/p>

* * *

最終,庫克公司和戴爾公司并沒有選擇合作。他們都無法相信“對方一定能夠遵守約定”。所以,結果和庫克當初預計的一樣,庫克公司和戴爾公司都支持布什方式,X汽車也選擇了布什公司作為技術委托方。雖然庫克用“盡管并不是最好的結果,但總算賺到了一些。少賺總比不賺強。”來安慰自己,但心中卻總感覺有些難以釋懷。

理論

二、占優策略

前文中提到的案例1,是以博弈論中最著名的模型“囚徒困境”為基礎改編的。

雖然囚徒困境是博弈論中最古典的模型,但在現實的商務活動中十分常見。比如新技術的開發競爭、在媒體上的廣告競爭、環境問題的成本負擔、零售業的價格競爭等。在這些情況下,每個參與者都難以預先獲得競爭對手的行動和信息,而且一旦自身不采取某種行動,競爭對手采取了這一行動的話,自己就會單方面受到損害。

那么,為了更深入地了解囚徒困境,讓我們對案例1進行一下整理。

(一)參與者

“庫克公司”與“戴爾公司”兩個。這里用參與者1代表“庫克公司”,參與者2代表“戴爾公司”。

(二)策略

兩個參與者都可以采取“支持安德森方式”或者“支持布什方式”的策略。將所有可能采取的策略進行排列組合,會得出以下4種情況(括號內順序為參與者1的策略,參與者2的策略)。

(支持安德森方式,支持安德森方式)

(支持安德森方式,支持布什方式)

(支持布什方式,支持安德森方式)

(支持布什方式,支持布什方式)

(三)收益

在上述4種情況下,庫克公司和戴爾公司所能夠獲得的收益如下。

(支持安德森方式,支持安德森方式)

(+45,+45)

(支持安德森方式,支持布什方式)

(0,+50)

(支持布什方式,支持安德森方式)

(+50,0)

(支持布什方式,支持布什方式)

(+37.5,+37.5)

(四)收益矩陣

像上述內容這樣,只是將博弈的策略和收益羅列出來,還是很難理解這個博弈的本質、也難以預測各參與者究竟會采取怎樣的行動。在這個時候,我們就需要將各參與者的行動整理成圖表。本節介紹的單階段同時兩人博弈(參與者同時采取行動的兩人博弈)一般可以整理為如圖表1-2這樣的收益矩陣。在收益矩陣中,一般將參與者1的行動作為縱軸,參與者2的行動作為橫軸。括號內的收益也按照參與者1,參與者2的順序標記。

圖表1-2 庫克公司與戴爾公司的收益矩陣

接下來,讓我們通過收益矩陣中的數字來對這個博弈進行一下分析。對于庫克公司來說,“支持安德森方式”和“支持布什方式”哪一個更有利呢?我們先來看一看參與者1和參與者2分別能夠獲得多少收益。

(五)參與者1的收益:參與者2支持安德森方式的情況

首先比較參與者2選擇“支持安德森方式”的情況下,參與者1的收益(括號內第一個數字)。如果庫克公司也表明“支持安德森方式”,那么X汽車就會采用安德森方式,這樣庫克和戴爾公司都能參與到這個項目中來。在這種情況下,庫克公司的收益是45億日元。

但如果庫克公司支持布什方式,X汽車采用布什方式,那么戴爾公司就被排除到項目外。在這種情況下,庫克公司能夠得到50億日元的最大收益。

(六)參與者1的收益:參與者2支持布什方式的情況

假設戴爾公司同樣選擇支持布什方式。那么我們就需要比較收益矩陣中“支持布什方式”的縱列。如果庫克公司支持安德森方式,那么X汽車就會采用合計投資額較高的布什方式。結果是戴爾公司參與到項目中去,庫克公司被排除到項目外。在這種情況下,庫克公司的收益為零。

另一方面,如果庫克公司支持布什方式,X汽車也采用布什方式的話,庫克公司和戴爾公司都能夠參與到項目中來。在這種情況下,兩家公司都能獲得37.5億日元的收益。

綜上所述,不管參與者2支持安德森方式還是支持布什方式,參與者1都應該支持布什方式,這樣能夠保證獲得更多的收益。

(七)參與者2的收益

戴爾公司在考慮自身收益的時候,可以參照收益矩陣,比較括號內第二個數字(戴爾公司的收益)。經過分析可以發現,不管庫克公司如何選擇,戴爾公司都應該支持布什方式,這樣能夠保證獲得更多的收益。

類似這種不管博弈的其他參與者采用何種策略,自己只要采取特定策略就能夠獲得較高收益的情況下,這種策略就被稱為“占優策略”。

在本節的這個案例中,庫克公司和戴爾公司都擁有占優策略。那就是不管對方采取何種策略,自己都選擇“支持布什方式”。這樣一來,雙方都采用“支持布什方式”的策略,就是這個博弈的解。最終,兩家企業分別獲得37.5億日元的收益。

(八)囚徒困境

本節的案例是以博弈論中最著名的“囚徒困境”模型為基礎制作的。在原版的囚徒困境中,兩名共同犯案的強盜是參與者。這兩個人分別被捕并且被關押在不同的房間中接受審問。

警方并沒有兩人共同犯案的證據,如果兩名強盜都不承認共同犯案的罪行,那么就只能按照他們當前所犯的罪行各自判處1年有期徒刑。但如果其中一方坦白,而另一人抵賴的話,那么坦白的人就會被無罪釋放,抵賴的人則被判處20年有期徒刑。如果兩個人都坦白的話,那么他們都會被處以10年有期徒刑。

將上述情況整理成收益矩陣如圖表1-3所示。括號內的數字之所以用了負數,是因為對犯罪者來說,刑期越短收益越高(年數增加收益就是負數)。

圖表1-3 囚徒困境

在這個原版的“囚徒困境”之中,兩名強盜都選擇“坦白”這一占優策略,結果就是兩人都被判處10年有期徒刑。

三、使占優策略失效的方法

存在占優策略的情況下,博弈的解只有一個。也就是說,在本節這個案例之中,兩家公司都會選擇“支持布什方式”的策略,沒有其他的可能性。但正如我們在收益矩陣中看到的那樣,對于參與者來說這個解并不是最優解。如果兩家公司都選擇“支持安德森方式”,那么兩家公司都能多獲得7.5億日元的收益。

在類似這樣的案例中,兩個參與者都想獲得更多收益并不容易。因為雙方都對事前協議持不信任的態度。比如在案例1中戴爾公司就提出“一起支持安德森方式”的建議,但庫克公司并沒有接受。就算兩家公司事前達成了協議,也很難一直互相信任直到最后。

如果兩家公司事前達成了“一起支持安德森方式”的合作協議,但其中一方背叛選擇了“支持布什方式”,那么遵守協議選擇“支持安德森方式”的一方就一點收益也得不到,而背叛的一方則將賺取巨額收益。在像這樣只進行一次同時博弈的情況下,只要有占優策略存在,參與者就很難做出其他的選擇。

類似于囚徒困境的情況在現實的商業活動中也十分常見。特別是在雙方只進行一次博弈(交易)的情況下,背叛對方讓自己獲取更多收益的誘惑非常大,當然任何人都能想到這一點。因為雙方都害怕遭到背叛,所以即便明知道獲得的收益較少,也只能選擇占優策略。

在面對“囚徒困境”的時候,雙方要想獲取更多的收益,可以采取以下的方法。

(一)對背叛者施加懲罰

通過對背叛者施加懲罰,可以降低損人利己帶來的誘惑。在本節的案例中,雙方可以簽訂一份合作協議,規定如果任何一方違反合作協議,選擇“支持布什方式”,那么就要向受損害的一方支付巨額的賠償。在不考慮這份協議是否具備法律效力的情況下,這樣做可以改變這次博弈的收益,使占優策略失去效果。

假設背叛的一方要支付給受損害的一方15億日元賠償金,那么這次博弈的收益矩陣就會變成圖表1-4那樣。如果雙方全都選擇了背叛,都支持布什方式,那么雙方相互賠償15億日元就自動抵消了,最終的結果和之前的收益(+37.5,+37.5)相同。

圖表1-4 有懲罰情況下的收益矩陣

在圖表1-4所示的博弈中就不存在占優策略了。假設我們站在庫克公司的立場上。如果我們背叛對方選擇“支持布什方式”,那么最終獲得的收益(35億日元)比“支持安德森方式”獲得的收益(45億日元)更低。

因此,不管是庫克公司還是戴爾公司,都從囚徒困境中擺脫了出來,可以選擇對雙方都更加有利的“支持安德森方式”。這種簽訂合作協議后的博弈,實際上與我在下一節中即將為大家介紹的“夫妻博弈”十分相似。這種解決方法通過“改變現有博弈”使結果更符合雙方的期望。

(二)增加博弈(交易)次數

另一種解決方法就是增加庫克公司和戴爾公司之間的交易次數。如果兩家企業今后還有繼續合作的可能性,那么為了追求眼前的收益而背叛對方,可能會對今后的合作造成影響。

遭到背叛的一方在今后的合作之中肯定會采取相應的報復行動??紤]到這一點的話,“追求眼前的收益而背叛對方”就不是最好的選擇。

也就是說,通過將博弈從“單階段”變成“重復”,可能會得出不同的解決方法。關于這部分內容我將在第2章中為大家做詳細的說明。

比如日本的汽車生產企業和零件供應商之間的連續交易。即便一家從未合作過的供應商給出的價格很低,汽車生產企業也更愿意選擇自己比較熟悉的供應商。

盡管類似于這樣的交易習慣經常被美國當作表現日本市場封閉性的反面教材加以批判,但換一個角度來看的話,這也是對雙方來說風險都比較小的商業選擇。對于汽車生產企業來說,避免了遭到零件供應商背叛使汽車出現故障的風險,對零件供應商來說,避免了遭到汽車生產企業背叛強行壓低采購價格的風險。也就是說,通過增加參與者進行博弈(交易)的次數,降低出現雙方不愿看到的結果的風險。

主站蜘蛛池模板: 仙桃市| 曲沃县| 安陆市| 高尔夫| 东辽县| 龙口市| 邵阳县| 玉林市| 英吉沙县| 迭部县| 麻江县| 贵德县| 双柏县| 东莞市| 威海市| 当阳市| 闻喜县| 行唐县| 乌海市| 疏附县| 荔波县| 潞城市| 灵山县| 邢台市| 陆河县| 家居| 大邑县| 阳高县| 邵东县| 奇台县| 康乐县| 福安市| 平武县| 柳林县| 炎陵县| 嘉鱼县| 西昌市| 乐都县| 怀柔区| 平陆县| 河北省|