官术网_书友最值得收藏!

第九章 博弈論初步

一、博弈論的幾個基本概念

博弈論是研究在策略性環(huán)境中如何進(jìn)行策略性決策和采取策略性行動的科學(xué)。在策略性環(huán)境中,每一個人進(jìn)行的決策和采取的行動都會對其他人產(chǎn)生影響。因此,每個人在進(jìn)行策略性決策和采取策略性行動時,要根據(jù)其他人的可能反應(yīng)來決定自己的決策和行動。

1.博弈參與人

參與人或稱局中人,是指博弈中的決策主體,即在博弈中進(jìn)行決策的個體。參與人既可以是個人,也可以是團(tuán)體(企業(yè)或國家)。每個參與人的目標(biāo)是通過選擇行動使自己的效用最大化。

2.策略

策略是指參與人選擇行為的規(guī)則,也就是指參與人應(yīng)該在什么條件下選擇什么樣的行動,以保證自身利益最大化。

3.支付函數(shù)

支付函數(shù)也稱為效用函數(shù),表明了博弈的參與人采取的每種策略組合的結(jié)果或收益,它是所有參與人策略或行動的函數(shù),是每個參與人真正關(guān)心的東西。

4.支付矩陣

參與博弈的多個參與人的收益可以用一個矩陣或框圖表示,這樣的矩陣或框圖稱之為支付矩陣,也稱之為博弈矩陣或收益矩陣。

其中,博弈參與人、參與人的策略和參與人的支付構(gòu)成了博弈須具有的三個基本要素。表9-1即為一個支付矩陣。

表9-1  支付矩陣

說明: 未命名

二、同時博弈:純策略均衡

“同時博弈”是參與人同時進(jìn)行決策或行動的博弈。在同時博弈中,在給定其他參與人的策略時,某個參與人的最優(yōu)策略稱之為該參與人的條件優(yōu)勢策略(簡稱條件策略),而包括該參與人的條件策略以及這些條件在內(nèi)的所有參與人的策略組合稱之為該參與人的條件優(yōu)勢策略組合(簡稱條件策略組合)。

1.占優(yōu)策略

在一些特殊的博弈中,一個參與人的最優(yōu)策略可能并不依賴于其他人的選擇。也就是說,無論其他參與人采取什么策略,該參與人的最優(yōu)策略是惟一的,這樣的策略稱之為占優(yōu)策略。如表9-2所示,通過對支付矩陣的分析可以看出,如果A、B兩廠商都是理性的,則這個博弈的結(jié)果是兩廠商都做廣告,即不管一個廠商如何決定,另外一個廠商都會選擇做廣告。這種策略均衡稱之為占優(yōu)策略均衡(equilibrium in dominant strategies)。

表9-2  廣告博弈的支付矩陣

說明: HWOCRTEMP_ROC00

2.納什均衡

并不是每個博弈的各個參與人都有一個占優(yōu)策略。如表9-3所示,通過對支付矩陣的分析可以看出,現(xiàn)在廠商A沒有占優(yōu)策略,它的最優(yōu)決策取決于廠商B的選擇。如果廠商B做廣告,則廠商A最好也做廣告;但如果廠商B不做廣告,廠商A不做廣告又是最好的選擇。這種均衡就是納什均衡(Nash equilibrium)。所謂納什均衡,指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨(dú)改變策略都不會得到好處。即如果在一個策略組合中,當(dāng)所有其他人都不改變策略時,沒有人會改變自己的策略,則該策略組合就是一個納什均衡。

表9-3  廣告博弈的支付矩陣

說明: HWOCRTEMP_ROC10

3.納什均衡與占優(yōu)策略均衡的區(qū)別

每一個占優(yōu)策略均衡一定是納什均衡,但并非每一個納什均衡都是占優(yōu)策略均衡。占優(yōu)策略均衡是有條件的納什均衡。

一個博弈可能存在一個以上的納什均衡,但是一個博弈也可能不存在純策略納什均衡,如表9-4所示。

表9-4  沒有納什均衡的同時博弈

說明: HWOCRTEMP_ROC40

4.尋找納什均衡的方法——條件策略下劃線法

對于一個簡單的“二人同時博弈”,可以用一個以二元數(shù)組為元素的支付矩陣來表示,并用“條件策略下劃線法”來確定它的納什均衡。具體步驟如下:

(1)把整個博弈的支付矩陣分解為兩個參與人的支付矩陣。

(2)在第一個(即位于整個博弈矩陣左方的)參與人的支付矩陣中,找出每一列的最大者,并在其下畫線。

(3)在第二個(即位于整個博弈矩陣上方的)參與人的支付矩陣中,找出每一行的最大者,并在其下畫線。

(4)將已經(jīng)畫好線的兩個參與人的支付矩陣再合并起來,得到帶有下劃線的整個博弈的支付矩陣。

(5)在帶有下劃線的整個的支付矩陣中,找到兩個數(shù)字之下均畫有線的支付組合。由該支付組合代表的策略組合就是博弈的納什均衡。

5.囚徒困境

囚徒困境的博弈模型的假設(shè)條件是:甲、乙兩個被懷疑為合謀偷竊的嫌疑犯被警方抓獲,但警方對他們偷竊的證據(jù)并不充分。他們每一個人都被單獨(dú)囚禁,并單獨(dú)進(jìn)行審訊,即雙方無法互通信息。警方向這兩個嫌疑犯交待的量刑原則是:如果一方坦白,另一方不坦白,則坦白者從寬處理,判刑1年;不坦白者從重處理,判刑7年。如果兩人都坦白,則每人都各判刑5年。如果兩個都不坦白,則警方由于證據(jù)不足,只能對每個人各判刑2年。表9-5的支付矩陣描述了這一博弈。表中的報酬均為負(fù)數(shù),以表示判刑的年數(shù)。

表9-5  囚徒困境

說明: 未命名

通過分析可以看出,囚徒困境的博弈有一個占優(yōu)策略均衡(坦白、坦白)。但是,如果兩人都是選擇不坦白(即合作),則都可以獲得最好的結(jié)局。很清楚,囚徒困境的占優(yōu)策略均衡反映了一個矛盾:即個人理性和團(tuán)體理性的沖突。

三、同時博弈:混合策略均衡

并不是所有的博弈都存在納什均衡。比如,如表9-6所示。這博弈就不存在純策略納什均衡,但卻存在混合策略納什均衡。混合策略納什均衡是這樣一種均衡,在這種均衡下,給定其他參與人的策略選擇概率,每個參與人都為自己確定了選擇每一種策略的最優(yōu)概率。

表9-6  社會福利博弈

說明: 未命名

所有參與人的混合策略的組合構(gòu)成“混合策略組合”。混合策略組合與參與人的支付的乘積之和為參與人的期望支付。當(dāng)其他參與人的混合策略確定之后,某個參與人選擇的可以使自己的期望支付達(dá)到最大的混合策略是該參與人的條件混合策略(其幾何表示為“條件混合策略曲線”)。不同參與人的條件混合策略曲線的“交點(diǎn)”就是混合策略條件下的納什均衡。可以證明,混合策略均衡總是存在的。

四、序貫博弈

“序貫博弈”是參與人的決策和行動有先有后的博弈。描述序貫博弈的更加方便也更加自然的工具是“博弈樹”。博弈樹由“點(diǎn)”(包括“起點(diǎn)”、“中間點(diǎn)”、“終點(diǎn)”)、連接點(diǎn)的“線段”以及標(biāo)在這些點(diǎn)和線段旁邊的文字和數(shù)字組成。在博弈樹中,一個納什均衡代表一條均衡的路徑。在該均衡路徑上,沒有哪個參與人愿意單獨(dú)改變自己的策略。

說明: 未命名

圖9-1  博弈樹

在序貫博弈中,可能存在多個納什均衡的情況。在多個納什均衡中,有些可能并不合理。所謂對納什均衡的“精煉”,就是要從眾多的納什均衡中進(jìn)一步確定“更好”的納什均衡。納什均衡的精煉方法通常是使用所謂的“逆向歸納法”,具體包括以下兩個步驟:

第一步,先從博弈的最后階段的每一個決策點(diǎn)開始,確定相應(yīng)參與人此時所選擇的策略,并把參與人所放棄的其他策略刪除,從而得到原博弈的一個簡化博弈。

第二步,再對簡化博弈重復(fù)步驟一的程序,直到最后,得到原博弈的一個最簡博弈。這個最簡博弈,就是原博弈的解;而在存在多重納什均衡時,它就是對納什均衡的精煉。

推薦閱讀
  1. 2019年對外漢語教師資格考試(高級)《現(xiàn)代漢語及古代漢語》筆記和典型題(含歷年真題)詳解【視頻講解】
  2. 2020年廣東省事業(yè)單位招聘考試《公共基礎(chǔ)知識》考點(diǎn)精講及典型題(含歷年真題)詳解
  3. 證券從業(yè)資格考試《金融市場基礎(chǔ)知識》過關(guān)必做2000題(含歷年真題)(2016)
  4. 2020年安徽省社區(qū)工作者公開招聘考試《社區(qū)基礎(chǔ)知識》專項(xiàng)題庫【歷年真題+章節(jié)題庫+模擬試題】
  5. 2019年下半年全國統(tǒng)考教師資格考試《語文學(xué)科知識與教學(xué)能力》(初級中學(xué))復(fù)習(xí)全書【核心講義+歷年真題詳解】
  6. 2020年河北省公安招警考試《公安專業(yè)科目》考點(diǎn)精講及典型題(含歷年真題)詳解
  7. 2020年山西省社區(qū)工作者公開招聘考試《社區(qū)基礎(chǔ)知識》專項(xiàng)題庫【真題精選+章節(jié)題庫+模擬試題】
  8. 2019年河南省教師招聘考試《小學(xué)教育理論綜合知識》復(fù)習(xí)全書(核心講義+歷年真題詳解)
  9. 2020年湖南省公安招警考試《招警專業(yè)科目》考點(diǎn)精講及典型題(含歷年真題)詳解
  10. 2019年河南省教師招聘考試《幼兒園教育理論綜合知識》專用教材(備考指南+考點(diǎn)精講+典型題詳解)
  11. 全國統(tǒng)考教師資格考試《綜合素質(zhì)(小學(xué))》專用教材(2016)
  12. 2020年浙江省事業(yè)單位招聘考試《職業(yè)能力傾向測驗(yàn)》考點(diǎn)精講及典型題(含歷年真題)詳解
  13. 國家電網(wǎng)招聘考試必刷2000題(電工類本科、專科)
  14. 2019年遼寧省教師招聘考試《小學(xué)教育理論基礎(chǔ)知識》專用教材(備考指南+考點(diǎn)精講+典型題詳解)
  15. 會計基礎(chǔ)歷年真題及命題預(yù)測試卷
主站蜘蛛池模板: 年辖:市辖区| 顺昌县| 阳高县| 迁安市| 油尖旺区| 阿拉善盟| 九龙城区| 榆社县| 陵川县| 裕民县| 宁都县| 曲麻莱县| 乐山市| 辛集市| 湘潭县| 高台县| 静宁县| 历史| 永顺县| 禄劝| 宜州市| 库尔勒市| 阿拉善右旗| 墨竹工卡县| 吉安县| 平泉县| 沙河市| 榆中县| 日喀则市| 洞口县| 花莲市| 逊克县| 综艺| 洛阳市| 荔浦县| 精河县| 景宁| 炎陵县| 隆子县| 洱源县| 梁平县|