官术网_书友最值得收藏!

第五章 博弈論及其應用

第一節 博弈論

一、名詞解釋

1納什均衡(上海大學2010研;中山大學2012研;中國海洋大學2012研;廈門大學2006、2013研;廈門大學2013研;北京師范大學2014研;中央財經大學2012、2014、2015研;湘潭大學2014、2015研)

答:納什均衡(Nash Equilibrium)又稱為非合作均衡,是博弈論的一個重要術語,以提出者約翰·納什的名字命名。納什均衡是指這樣一種策略集,在這一策略集中,每一個博弈者都確信,在給定競爭對手策略的情況下,他選擇了最好的策略。納什均衡是由所有參與人的最優戰略所組成的一個戰略組合,也就是說,給定其他人的戰略,任何個人都沒有積極性去選擇其他戰略,從而沒有人有積極性去打破這個均衡。

2混合策略(Mixed Strategy)(廈門大學2010研;西安交通大學2014研;湘潭大學2016研)

答:混合策略(mixed strategy)指參與人使他們的策略選擇隨機化——即對每項選擇都指定一個概率,并按照這些概率選擇策略。混合策略納什均衡是這樣一種均衡,在這種均衡下,給定其他參與人的策略選擇概率,每個參與人都為自己確定了選擇每一種策略的最優概率。混合策略是相對于純策略而言的。并不是所有的博弈都存在純策略納什均衡,但是混合策略均衡總是存在的。

3合作博弈(廈門大學2012研;中山大學2013研)

答:合作博弈是指各博弈方可以談定能使它們設計聯合策略的有約束力的合同的博弈。廠商之間進行的經濟博弈既可以是合作的也可以是非合作的。如果不可能談判并執行有約束力的合同,博弈就是非合作的;如果能設計出合同,則是合作的。

合作博弈的一個例子是買方和賣方之間就一塊地毯的價格討價還價。如果地毯生產成本為100美元,而買方對其評價是200美元,因為雙方同意以101~199美元之間任一價格成交都將最大化買方的消費者剩余與賣方的利潤之和,并使雙方都得到好處,因此該博弈可能有合作的解。

合作和非合作博弈之間的基本差別在于簽訂合同的可能性,在合作博弈中有約束力的合同是可能存在的,而在非合作博弈中它們是不可能的。

二、單項選擇題

1考慮兩寡頭廠商A和B的如下支付矩陣,二者的(納什)均衡策略組合為(  )。(電子科技大學2010、2012研)

A.(U,L)

B.(D,R)

C.(U,R)

D.(D,L)

【答案】B

【解析】在一個納什均衡里,任何一個參與者都不會改變自己的最優策略,如果其他參與者均不改變各自的最優策略,即要求任何一個參與者在其他參與者的最優策略選擇給定的條件下,其選擇的策略也是最優的。對于本題,當B選擇U時,A會選擇R,因為5>3;當B選擇D時,A會選擇R,因為2>0。當A選擇L時,B會選擇U,因為4>3;當A選擇R時,B會選擇D,因為1>0。因此,依據納什均衡定義,可知(D,R)是納什均衡。

2下列說法錯誤的是(  )。(中山大學2009研)

A.占優策略均衡一定是納什均衡

B.納什均衡不一定是占優策略均衡

C.占優策略均衡中,每個參與者都是在針對其他參與者的某個特定策略而做出最優反應

D.納什均衡中,每個參與者都是在針對其他參與者的最優反應策略而做出最優反應

【答案】C

【解析】占優策略均衡中,不論其他參與者采取何種策略,每個參與者都會選擇其自身的最優策略。

3甲乙兩人各在紙片上寫上“上”或“下”,然后雙方同時翻開紙片,如果兩人的字相同,那么甲贏2塊錢,乙輸兩塊錢;如果寫的字不同,那么乙贏1塊錢,甲輸1塊錢。下列關于該博弈納什均衡的描述哪一項是正確的?(  )(上海財經大學2009研)

A.甲以1/2概率選擇“上”;乙以1/2概率選擇“上”

B.甲以1/3概率選擇“上”;乙以1/3概率選擇“上”

C.甲以1/3概率選擇“上”;乙以1/2概率選擇“上”

D.甲以1/2概率選擇“上”;乙以1/3概率選擇“上”

【答案】A

【解析】根據題目條件可以得出甲乙兩人的收益矩陣,如表5-1所示。

表5-1 甲乙兩人的收益矩陣

可以看出,當甲選擇寫“上”時,乙必然會選擇寫“下”。同理,當甲選擇寫“下”時,乙必然會選擇寫“上”。因此,兩個人選擇寫“上”的概率都為1/2時才能達到均衡。

4考慮下面的策略式博弈:

這里a,b和c是不確定的數字。為保證(M,L)是占優策略,a,b和c應在什么區間?(  )。(上海財經大學2008研)

A.a>2,b<3,c任意

B.a>2,b>3,c任意

C.a>2,b>3,c<2

D.都不對

【答案】C

【解析】占優策略是指不論其他參與人如何選擇,每個參與人都有一個最優策略。要保證(M,L)成為占優策略,則對于行參與人,無論列參與人選擇L還是R,行的最優選擇都是M。當列參與人選擇L時,行最優選擇是M,則有a>2;當列選擇R時,行最優選擇是M,則有c<2;同理,當行選擇T、M、B時,列的占優選擇都是L,則有b>3。

5考慮一個囚徒困境的重復博弈。下列哪種情況將增加出現合作結果的可能性?(  )(上海財經大學2007研)

A.參與人對未來收益的評價遠低于對現期收益的評價

B.參與人之間的博弈是頻繁發生的

C.欺騙不容易被發現

D.從一次性欺騙中得到的收益比欺騙的成本更大

【答案】B

【解析】如果博弈重復無限次,就會有辦法影響對手的行為:如果這次拒絕合作,那么下一次對手也可以拒絕合作。只要雙方都充分關心將來的收益,那么,將來不合作的威脅就足以使他們采取帕累托有效率的策略。如果參與人之間的博弈是頻繁發生的,他們希望合作會引致將來的進一步合作,所以會增加合作結果的可能性。

6比較上策均衡和納什均衡,以下論斷正確的是(  )。(中山大學2005研)

A.納什均衡是比上策均衡要求更為嚴格的均衡解

B.上策均衡是比納什均衡要求更為嚴格的均衡解

C.上策均衡等價于納什均衡

D.無法判斷兩者中哪一個更為嚴格

【答案】B

【解析】上策均衡就是嚴格占優均衡,是指博弈中一個參與人的最優策略不依賴于其他人的策略選擇,不論其他人選擇什么策略,他的最優策略是唯一的。上策均衡是比納什均衡更強的一個博弈均衡概念。納什均衡只要求任何一個參與者在其他參與者的最優策略選擇給定的條件下,其選擇的策略也是最優的。

7假定甲乙兩個企業同時選擇“合作”或“抗爭”的經營策略。若兩個企業都選擇“合作”的策略,則每個企業的收益均為100;若兩個企業都選擇“抗爭”的策略,則兩個企業的收益都為零;若一個企業選擇“抗爭”的策略,另一個企業選擇“合作”的策略,則選擇“合作”策略的企業的收益為S,選擇“抗爭”策略的企業的收益為T。要使“抗爭”成為占優策略,S和T必須滿足條件(  )。(上海財經大學2005研)

A.S+T>200

B.S<T與T>100

C.S<0與T>100

D.以上都不是

【答案】C

【解析】根據已知條件可以寫出甲乙兩個企業的收益矩陣,如表5-2所示。

表5-2 甲乙兩個企業的收益矩陣

當甲選擇合作時,由于乙的占優策略是抗爭,所以T>100;當甲選擇抗爭時,乙的占優策略也是抗爭,所以S<0。因此,要使“抗爭”成為占優策略,S和T必須滿足條件:S<0與T>100。

三、計算題

1請根據下面給出的五個博弈回答問題:

(1)假設企業1和企業2進行同步博弈,請找出5個博弈中具有多重均衡的博弈,并給出均衡的描述。

(2)如果兩個企業進行的是序貫博弈,請找出5個博弈中企業1具有先動優勢的博弈,并給出均衡的描述。(中山大學2013研)

解:(1)博弈和博弈具有多重均衡博弈。其中博弈和博弈的均衡都為(策略B,策略Y)、(策略A,策略Z)。

在博弈中,先考慮企業1的策略選擇,若企業2選擇策略Y,則企業1的最優策略為B,此時支付矩陣為(6,6),若企業2選擇策略Z,則企業1的最優策略為策略A,此時支付為(6,6);同理,再考慮企業2的策略選擇,若企業1選擇策略A,則企業2的最優策略為Z,若企業1選擇策略B時,企業2的最優策略為Y。因此,納什均衡為(策略B,策略Y)、(策略A,策略Z),對應的支付矩陣分別為(6,6)、(6,6)。

在博弈中,先考慮企業1的策略選擇,若企業2選擇策略Y,則企業1的最優策略為B,此時支付矩陣為(2,8),若企業2選擇策略Z,則企業1的最優策略為策略A,此時支付為(4,6);同理,再考慮企業2的策略選擇,若企業1選擇策略A,則企業2的最優策略為Z,若企業1選擇策略B時,企業2的最優策略為Y。因此,納什均衡為(策略B,策略Y)、(策略A,策略Z),對應的支付矩陣分別為(2,8)、(4,6)。

(2)序貫博弈是指一個參與人首先采取行動,另一個參與人再作出反應。分析這種博弈,必須從博弈的終結開始由后往前推算。企業1具有先動優勢的博弈為博弈

圖5-1 序貫博弈

如圖5-1所示,先考慮企業2的選擇,若企業1選擇策略A,則企業2的最優策略為Z,此時納什均衡的支付矩陣為(4,6),若企業1選擇策略B,則企業2的最優策略為Y,此時納什均衡的支付矩陣為(2,8)。如果企業1先選擇策略A,則企業1得到的支付為4,大于后行動的2,企業2的威脅是不可置信的,如果它威脅企業1如果企業1選擇A策略,它將選擇Y策略,那么它自己的得益為5,小于選擇Z策略時的得益。此時企業1具有先動優勢,最終的均衡為(策略A,策略Y),對應的支付矩陣為(4,6)。

2表5-3為兩競爭對手的博弈結果矩陣:

表5-3 兩競爭對手的博弈結果矩陣

請問:什么是納什均衡?求出該博弈的所有可能的納什均衡,利用圖形說明求出的納什均衡的意義。(中央財經大學2010研)

解:納什均衡又稱為非合作博弈均衡,指如果其他參與人不改變自己的策略,任何一個參與人都不會改變自己策略的均衡狀態。即如果給定參與人B的選擇,參與人A的選擇是最優的,并且給定參與人A的選擇,參與人B的選擇也是最優的。那么,這樣一組策略就是一個納什均衡,即給定其他人的選擇,每個參與人都作出了最優的選擇。

從表5-3該博弈結果矩陣可知存在兩個可能的納什均衡:兩競爭對手均奮爭,兩競爭對手均妥協。

不論A、B均奮爭還是均妥協,總的博弈支付為3,比一方奮爭另一方妥協的支付大,如表5-4所示。

從表5-4可以看出,兩競爭對手均奮爭和兩競爭對手均妥協都是納什均衡解,并且帶來的總支付一樣。

表5-4 博弈狀態及其支付

3甲、乙兩個學生決定是否打掃宿舍。無論對方是否參與,每個參與人的打掃成本都是8;而每個人從打掃中的獲益則是5乘以參與人數。

(1)請用一個博弈簡單描述上述情景。

(2)找出該博弈的所有納什均衡。(中山大學2010研)

解:(1)共有以下四種情況:

當甲乙都參與時,每個人的收益均為5×2-8=2。

當甲參與乙不參與時,甲收益為5×1-8=-3;

乙收益為5×1-0=5。

當甲不參與乙參與時,甲收益為5×1-0=5;

乙收益為5×1-8=-3。

當甲乙都不參與時,每個人的收益均為0。

具體博弈矩陣如表5-5所示:

表5-5 博弈的收益矩陣

(2)從表5-5中可以看出,該博弈的納什均衡是甲不參與乙也不參與,這一均衡解也是占優策略均衡。從參與人甲的角度看,不論參與人乙參與不參與打掃宿舍,不參與打掃宿舍都是參與人甲的較好的選擇。同樣的情形,從參與人乙的角度看,不參與打掃宿舍也是參與人乙的較好的選擇。所以,這是一個占優策略均衡,即雙方都沒有動力去改變這一局面,最后誰都不去打掃宿舍。

可以看出,如果甲乙兩人都參與打掃宿舍,則他們的境況就要比在其他選擇下更好一些。(參與,參與)是帕累托有效率的策略組合,而(不參與,不參與)則是帕累托低效率的策略組合。雙方從自己的理性出發的最優策略,從社會看來是最糟糕的策略。

4已知參與者A的策略集合為(T,M,B),參與者B的策略集合為(L,C,R),雙方博弈的支付矩陣如表5-6所示。

表5-6 博弈的支付矩陣

根據以上條件,回答以下問題:

(1)何謂占優策略?博弈雙方是否都具有占優策略?

(2)何謂Nash均衡?該博弈的納什均衡是什么?

(3)納什均衡與占優策略的聯系如何?(上海交通大學2006研)

解:(1)占優策略是指博弈中一個參與人的最優策略不依賴于其他人的策略選擇,不論其他人選擇什么策略,他的最優策略是唯一的。

根據占優策略的定義,在如表5-6所示的博弈中,對于參與者A而言,當參與者B選擇策略L時,他的最優策略是B,當參與者B選擇策略C或R時,他的最優策略是M,所以A不存在占優策略;對于參與者B而言,存在著策略C占優于策略L和R,因此策略C是他的占優策略。

(2)納什均衡是指這樣一種策略集,在這一策略集中,每一個博弈者都確信,在給定競爭對手策略決定的情況下,他選擇了最好的策略。如果其他參與人不改變自己的策略,任何一個參與人都不會改變自己策略的均衡狀態。即如果給定B的選擇,A的選擇是最優的,并且給定A的選擇,B的選擇也是最優的。那么,這樣一組策略就是一個納什均衡,即給定其他人的選擇,每個參與人都作出了最優的選擇。

該博弈的納什均衡是(M,C)。因為如果參與者A選擇M,則參與者B會選擇C;如果參與者B選擇C,則參與者A會選擇M。所以,(M,C)是一個納什均衡。

(3)納什均衡與占優策略的聯系

占優策略均衡是比納什均衡更強的一個博弈均衡概念。占優策略均衡要求任何一個參與者對于其他參與者的任何策略選擇來說,其最優策略都是唯一的。而納什均衡只要求任何一個參與者在其他參與者的最優策略選擇給定的條件下,其選擇的策略是最優的。所以,占優策略均衡一定是納什均衡,而納什均衡不一定就是占優策略均衡。

5某外資企業計劃在北京和上海建立生產基地,如果兩個地區的地方政府都不推出稅收返還政策,那么,外資企業將選擇在北京建立一個大的生產基地,在上海建立一個小型生產基地,這將分別為兩個地區帶來30和10的稅收收入。如果其中一個政府推出返還10的稅收政策,而另一個政府沒有推出相應的政策,那么企業將把大型生產基地設立在具有稅收優惠的地區。如果兩個地方政府同時推出返還10的稅收政策,那么企業的選擇將與完全沒有稅收優惠時相同。

(1)建立一個博弈描述上述地方政府的招商引資行為。

(2)求出上述博弈的Nash均衡。(中山大學2012研)

解:(1)這個博弈可以用表5-7來表示。

表5-7 地方政府招商引資博弈收益矩陣

(2)納什均衡,指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處。即如果在一個策略組合中,當所有其他人都不改變策略時,沒有人會改變自己的策略,則該策略組合就是一個納什均衡。

由(1)中的收益矩陣可知:當北京選擇“返還10稅收”時,上海選擇“不返還稅收”;當北京選擇“不返還稅收”時,上海選擇“返還10稅收”;當上海選擇“不返還稅收”時,北京也選擇了“不返還稅收”;當上海選擇“返還10稅收”時,北京也選擇了“返還10稅收”,從這個分析,可以得出,因為在給出對方的選擇時,己方的選擇不是一致的,因此該博弈不存在純策略納什均衡。

下面求混合策略納什均衡。假設北京選擇返還稅收和不返還稅收的概率分別是p和1-p,上海選擇返還稅收和不返還稅收的概率分別是q和1-q。

北京的期望支付為:EB=20pq+20p(1-q)+10(1-p)q+30(1-p)(1-q)=10p(2q-1)-20q+30

上海的期望支付為:ES=10p(1-q)+20(1-p)q+10(1-p)(1-q)=10q(1-2p)+10

因此,北京的混合策略為:

上海的混合策略為:

如圖5-2所示,混合策略納什均衡是北京和上海都分別以0.5的概率選擇返還稅收。

圖5-2 混合策略均衡

第二節 博弈論的應用

一、單項選擇題

1下列博弈中的混合策略均衡是(  )。(上海財經大學2007研)

A.1采取A的概率是3/7,采取B的概率是4/7;2采取U的概率是3/7,采取D的概率是4/7

B.1采取A的概率是4/7,采取B的概率是3/7;2采取U的概率是4/7,采取D的概率是3/7

C.1采取A的概率是4/7,采取B的概率是3/7;2采取U的概率是3/7,采取D的概率是4/7

D.1采取A的概率是1/2,采取B的概率是1/2;2采取U的概率是1/2,采取D的概率是1/2

【答案】C

【解析】設1選A的概率為p,則選B的概率為1-p;2選U的概率是q,則選D的概率為1-q。根據1選A、B無差異,2選U、D無差異,可列出以下方程式:

解得:p=4/7,q=3/7。

2考慮兩個競爭廠商的博弈,初始,企業X在區域1,企業Y在區域2。兩個企業考慮是否進入對方的市場。不同情形下,他們的凈利潤由下面的表格描述:

如果企業Y進入區域1是一個占優戰略,那么有(  )。(上海財經大學2012研)

A.10>D和20>E

B.F>B和10>D

C.C>A和20>E

D.A>C和B>F

【答案】C

【解析】由于“進入區域1”是企業Y的一個占優策略,則不論企業X選擇何種策略,企業Y都會選擇“進入區域1”,從而必有:C>A,20>E。

3在一條狹窄巷子里,兩個年青人騎著自行車相向而行。每人都有兩個策略,即或者選擇“沖過去”或者選擇“避讓”。如果選擇“避讓”,不管對方采取什么策略,他得到的收益都是0。如果其中一個人采取“沖過去”的策略,如果對方采取“避讓”,那么他得到的收益是9;如果對方不避讓,那么他得到的收益是-36。這個博弈有兩個純策略納什均衡和(  )。(上海財經大學2008、2013研)

A.一個混合策略納什均衡,即兩人都以80%概率選擇“避讓”,以20%的概率選擇“沖過去”

B.兩個混合策略納什均衡,即每個青年人輪流采取避讓或者沖過去

C.一個混合策略納什均衡,即一人以80%的概率選擇“避讓”,另一人以20%的概率選擇“沖過去”

D.一個混合策略納什均衡,即兩人都以40%的概率選擇“避讓”,以60%的概率選擇“沖過去”

【答案】A

【解析】根據題中條件可寫出兩人的收益矩陣,如表5-8所示。

表5-8 兩人的收益矩陣

從收益矩陣可看出,這個博弈有兩個純策略納什均衡(9,0),(0,9)。設甲選擇“沖過去”的概率為r,乙選擇“沖過去”的概率為c。甲的期望收益為-36cr+9(1-c)r=(9-45c)r,可見當c=0.2時,甲對于任何的0≤r≤1無差異。同理可得當r=0.2時,乙對于任何的0≤c≤1無差異。所以,存在一個混合策略納什均衡(0.2,0.2)。

4假設有兩家企業各要招聘一個工人,工資報酬都為1,假設有兩個工人同時去應聘,但他們只能選擇應聘一家企業。如果一家企業只有一個工人應聘,那么他得到這份工作;如果有兩個工人同時應聘,那么各有一半的可能得到這份工作。工人的偏好是風險中性的。下面哪一個判斷是正確的?(  )(上海財經大學2010研)

A.只有兩個納什均衡,即兩個工人應聘不同的企業

B.只有一個混合納什均衡,即兩個工人各以1/2的概率隨即選擇其中一個企業

C.有兩個純策略均衡和一個混合策略均衡,混合策略均衡時的期望支付大于純策略時的支付

D.有兩個純策略均衡和一個混合策略均衡,混合策略均衡時的期望支付小于純策略時的支付

【答案】D

【解析】假定甲乙兩人應聘A、B的收益矩陣如下所示:

由劃線法可知,存在兩個純策略納什均衡(A,B)、(B,A)。設甲應聘企業A的概率為p,乙應聘企業A的概率為q。對于甲來說,應聘企業A的期望收益等于應聘企業B的期望收益,即(1/2)pq+p(1-q)=1-p+(1/2)(1-p)(1-q);對于乙來說,應聘企業A的期望收益等于應聘企業B的期望收益,即(1/2)pq+1×q(1-p)=1-q+(1/2)(1-q)(1-p)。聯立解得p=0.5,q=0.5。所以,存在一個混合策略納什均衡(0.5,0.5)。混合策略均衡的期望支付顯然小于純策略時的支付。

二、計算題

1找出下列標準式博弈(normal-form game)的混合策略納什均衡,并繪出兩個參加者各自的反應曲線。(中山大學2008研)

解:(1)各自的期望收益

令r表示Mr.I選擇“T”的概率,那么,(1-r)就表示他選擇“B”的概率。同樣,令c表示Miss J選擇“R”的概率,那么(1-c)就表示他選擇“L”的概率。當r和c等于0或者1時,相應的策略就是純策略,除此之外就是混合策略均衡。

計算當Mr.I按概率r選擇“T”,而Miss J按概率c選擇“R”時,Mr.I的期望收益排列如下:

所以,Mr.I的期望收益為:2rc+(1-r)c+0+3(1-r)(1-c)=4cr-2c-3r+3;假定r增加了?r,Mr.I的收益變化=4c?r-3?r=(4c-3)?r。

當4c>3時,上式取正值;當4c<3時,上式取負值。因此,當c>0.75時,Mr.I會提高r值;而當c<0.75時,Mr.I會降低r;當c=0.75時,他對于任意的0≤r≤1無差異。

同理Miss J的期望收益為2c+2r-3cr,假定c增加了?c,Mr.I的收益變化=2?c-3r?c=(2-3r)?c。

當2>3r時,上式取正值;當2<3r時,上式取負值。因此,當r<2/3時,Miss J會提高c值;而當r>2/3時,Miss J會降低c值;當r=2/3時,她對于任意的0≤c≤1無差異。

(2)繪制反應曲線

先從Mr.I開始。如果Miss J選擇c=0,那么,Mr.I就會使r值盡可能的小,所以,r=0就是c=0時Mr.I的最優反應。并且,r=0一直都是Mr.I的最優反應,直到c=0.75時為止。當c=0.75時,位于0和1之間的任意r值都是最優反應。對于所有的c>0.75,Mr.I的最優反應是r=1。

同理,對于Miss J來說,如果Mr.I選擇r=0,那么,Mr.I就會使r值盡可能的大,所以,c=1就是r=0時Miss J的最優反應。并且,c=1一直都是Miss J的最優反應,直到r=2/3時為止。當r=2/3時,位于0和1之間的任意c值都是最優反應。對于所有的r>2/3,Miss J的最優反應是c=0。

圖5-3顯示的是他們各自的反應曲線。不難發現,它們相交于點(2/3,3/4),該點即為混合策略納什均衡。

圖5-3 最優反應曲線

2王剛和李梅作為一個小組完成作業。該作業通過與否是按照小組來評判的。通過對二人的效用都是3,沒通過的效用是0。二人可以選不努力(N),低努力(L),和高努力(H)。對于李梅,三種努力的成本分別是0,1,2;對于王剛三種努力的成本分別是0,2,4。只有當至少一個人選擇H或者兩人都選擇L時,小組才能順利通過。

(1)寫出所有博弈策略矩陣,并找出所有納什均衡。

(2)如果李梅可以觀察王剛的策略后再選擇自己的,寫出子博弈精煉納什均衡。

(3)如果王剛可以先觀察李梅的策略,再選擇自己的策略,求子博弈精煉納什均衡。

(4)王剛會更偏好哪一個策略?(北京大學光華管理學院2013研)

解:(1)本題中,只有當至少一個人選擇H或者兩人都選擇L時,小組才能順利通過,即只有(L,L),(H,L),(L,H)和(H,H),(H,N),(N,H)六種情況下,李梅和王剛兩人才能獲得效用(本題策略組合左側代表李梅,右側代表王剛)。根據題意,李梅和王剛的博弈策略矩陣如下:

所謂納什均衡指的是在該策略組合上,任何參與人單獨改變策略都不會得到好處。或者換個說法:如果在一個策略組合中,當所有其他人都不改變策略時,沒有人會改變自己的策略,則該策略組合就是一個納什均衡。所以此時的納什均衡策略是(H,N)和(L,L)。

(2)如果李梅可以觀察王剛的策略后再選擇自己的策略,則由王剛先做出決策,李梅再做出決策,可得到決策樹如下:

運用逆向法,在王剛選擇N時,李梅選擇H。在王剛選擇L時,李梅選擇L。在王剛選擇H時,李梅選擇N。再由王剛來做選擇,王剛會選擇N,所以子博弈精煉納什均衡為(H,N)。

(3)如果王剛可以觀察李梅的策略后再選擇自己的策略,則由李梅先做出決策,王剛再做出決策,同上題方法,可得到子博弈精煉納什均衡為(L,L)。

(4)王剛會選擇對于自己來說能得到最大效用,同時付出成本最小的策略,即(H,N)策略。此時他的效用為3,成本為0。

3找出如下博弈中A、B兩人的Nash-Equilibrium(含混合策略的均衡)(北京大學國家發展研究院2006研)

解:使用嚴格剔除劣策略法來求解。

對于B來講,乙嚴格占優于甲,因此B肯定不會選擇甲,于是剔除甲策略。在剩余的矩陣中,對于A來講,β嚴格占優于α,所以A不會選擇α,于是再剔除α策略。

重復嚴格剔除劣策略后,矩陣變為:

(1)分析如下:

A選β時,B最優的選擇是丙,因為8>6;

A選γ時,B最優的選擇是乙,因為9>8;

B選乙時,A最優的選擇是γ,因為10>7;

B選丙時,A最優的選擇是β,因為9>7。

可得出(γ,乙),(β,丙)是純策略均衡。

(2)另外該博弈還有一個混合策略均衡,求解如下:

設A以p的概率選擇策略β,B以q的概率選擇策略乙,則根據同等支付原則有:7q+9(1-q)=10q+8(1-q);6p+9(1-p)=8p+8(1-p)。

解得:p=1/3,q=1/4。

因此,(1/3,1/4)是一個混合策略均衡,表示A以1/3的概率選擇β,2/3的概率選擇γ;B以1/4的概率選擇乙,3/4的概率選擇丙時,這個混合策略組合就構成了一個納什均衡。

主站蜘蛛池模板: 靖宇县| 平阴县| 堆龙德庆县| 渭源县| 毕节市| 中超| 西贡区| 伊宁市| 电白县| 法库县| 安宁市| 兰考县| 宽甸| 射洪县| 焦作市| 永新县| 博罗县| 平泉县| 临泽县| 牙克石市| 普格县| 蕲春县| 邮箱| 宁波市| 金秀| 太保市| 磴口县| 阳信县| 衡阳县| 随州市| 凉城县| 临洮县| 甘泉县| 双鸭山市| 新民市| 三明市| 泽库县| 石狮市| 沧州市| 阿克苏市| 周至县|