博弈中的博弈方和得益
博弈就是若干個人或者團體之間的對抗,我們首先來了解一下什么是博弈當中的博弈方。
博弈方就是指在博弈過程中獨立決策并且獨立承擔博弈結果的個人或者團體。我們可以通過一個例子來具體了解。
再回到“田忌賽馬”的故事當中,出場人物有齊王、田忌、孫臏,還有雙方的賽馬,但真正的博弈方卻只有齊王和田忌。孫臏和雙方的賽馬雖然都參與到了博弈的過程當中,但是孫臏只負責進言,決定賽馬順序的還是田忌,同時賽馬結束之后“得王千金”的人也不是孫臏,而是田忌。所以孫臏并不是博弈中的博弈方。而賽馬只負責跑,其余的更無從談起。
或許有人覺得田忌和孫臏是一個團體,這種理解也是錯誤的。孫臏進言之后,要由田忌決定使不使用這樣的計策,所以孫臏并沒有決策權,同時也沒有承擔賽馬結果(得王千金)的權利,這就說明孫臏和田忌并不是一個團體,而是兩個獨立的個體。和賽馬一樣,兩者都是附屬于這場博弈的兩個博弈方,但自己不算博弈方。
博弈的基本工具是策略,不同博弈方之間的策略會產生極其復雜的變化,這種變化的復雜程度和博弈方的數量是成正比的,所以博弈方的數量就成了博弈結構的關鍵參數之一。因此,我們通常會把博弈按照博弈方的數量分成“單人博弈”、“雙人博弈”和“多人博弈”。博弈分析的難度也在這三者間遞增。這里需要特別說明的是,博弈方既可以是單個的人,也可以是一個組織或者團體。
“單人博弈”是最簡單的一種博弈,我們通過一個例子來了解。
小明要去買藥,因為還有十分鐘藥店就會關門,所以他必須用最快的速度趕往藥店,但是當他走到一個十字路口的時候卻忘記了應該向哪個方向拐彎(我們假設是應該向左拐)。此時他并沒有帶手機,而且街上也沒有其他行人。
作為一個博弈問題,它的各方面規定是這樣的:(1)有唯一的博弈方,也就是小明。(2)有向前走、向左走、向右走三種策略可供選擇。(3)這三個選擇中有一個方向會買到藥,也就是得益,我們可以記作“1”。而其余兩個方向則不會得益,我們可以記作“0”。所以三種策略所對應的得益分別是0、1、0。(4)因為只有一個博弈方,所以不存在行動次序問題。小明必須從三種策略中選出一種來達到自己的目的。
“單人博弈”不存在其他博弈方,我們因此認為它只是一般的優化問題,而不屬于博弈范疇。之所以我們要把它也放在博弈論中了解和分析,有以下兩個方面的原因:
1.單人博弈是博弈分析的基礎,在我們能夠很好地認識單人博弈之后,對于雙人博弈和多人博弈的理解也就更加容易。而且,我們分析多人博弈的時候通常會把它分成若干個單人博弈來進行。
2.為了完善博弈理論。
“雙人博弈”是由兩個獨立決策并且承擔博弈后果的博弈方組成的博弈。比起單人博弈來,其最大的不同就是博弈雙方需要考慮對方會選擇什么樣的策略,這是最常見,也是研究最多的一種博弈模式。大到兩個國家的談判,小到兩個人在地鐵中搶座位,都屬于雙人博弈。我們前面提到的田忌賽馬和囚徒困境等都屬于這個范疇。因為后面會涉及很多雙人博弈,所以這里我們就不再贅述,但是其中的一些需要注意的問題我們在這里了解一下。
第一,博弈雙方不一定是利益對抗的,因為他們的利益方向很可能會是一致的。例如兩個企業的強強聯合,甲企業的產品質量好,乙企業的銷售渠道廣。這時候兩個企業合作才是最佳的發展方式,如果對立起來,只能讓自己的得益變得更少。
第二,和單人博弈不同,信息量的多少并不能決定得益的多少。單人博弈中因為沒有其他博弈方的策略來影響得益,所以可以用信息的多寡來判斷。但是在雙人,包括多人博弈當中,除了信息量的多少之外,其他博弈方的策略選擇對自己的影響也是重要依據之一。在不同博弈方之間策略的相互作用下,得益的計算就變得非常復雜了。
第三,在雙人博弈當中,如果每個博弈方都片面地追求最大利益,那么導致的結果可能正好與期望相反。比如說在囚徒困境中,每個罪犯都追求最大利益,也就是無罪釋放的話,結果只能是兩個人都去坐牢。這給我們日常生活處理問題帶來一定的啟發,以后的章節中我們會進一步地分析和了解。
“多人博弈”,是有多個博弈方參與到博弈當中,而且每個博弈方都必須意識到其他博弈方的存在,并且意識到其他人的策略對自己策略的反作用。它的基本性質和特征與雙人博弈類似,所以我們可以借鑒或者直接采用雙人博弈的分析思路和方法。
但是,“多人博弈”的多個博弈方也會帶來更復雜的相互作用,比如說博弈方甲、乙、丙,甲和乙的策略都會對丙產生影響,但是同時甲和乙之間也會有相互作用,這就增加了我們分析和理解的難度。“多人博弈”中還會出現一些“破壞者”,就是他們的策略對自己本身并沒有任何作用,但是卻會對別人產生作用。比如說在選舉當中,a、b、c三人同時參加競選,b和c的票數不相上下。a自覺無望的情況下主動放棄了選舉,然后支持b,那么b就會以絕對的優勢取得勝利。
這里的a就是一個“破壞者”,他的策略對自己并沒有作用,但是卻使得本來旗鼓相當的b和c瞬間分出高下。破壞者的存在使得本來就復雜的情況變得更加復雜,因為他們的策略選擇很難被分析和判斷出來。
與雙人博弈還有一點不同,就是多人博弈的得益更加復雜。
這里說到了博弈的得益。所謂博弈的得益,就是指在博弈當中各個博弈方所獲得的利益。與投資理財類似,有可能賺錢,也有可能賠錢。所以博弈的得益有正有負,不可能只有獲利沒有損失。這里的得益可以是金錢或其他福利,也可以是某種資格或者權利。不同的得益會有不同的特征,這就會影響策略的選擇,從而影響博弈的結果。博弈的結果又會反過來影響博弈的得益,所以我們在分析的過程中就需要注意更多的情況和細節。
當我們把博弈各方的得益都加起來的時候,就叫做“社會總得益”。大多數博弈當中,策略組合的不同就會造成得益的不同,得益的不同就會造成“社會總得益”的不同,這種情況叫做“變和博弈”。例如“囚徒困境”,兩名犯人的選擇不同,就會造成最終結果的不同,那么“社會總得益”自然就不會相同。在這種博弈當中,我們可以從總得益的角度來分析其產生的效益,是“有效率”還是“無效率”或者“低效率”的。
但是也有一些情況是例外的,在有些博弈當中,博弈雙方的利益始終是對立的,一方得益的情況下另一方必定會損失。例如在兩個人的賭博當中,其中一個人贏多少,另一個人就會輸多少,所以他們的得益總和始終都是零,這種博弈叫做“零和博弈”。法律訴訟和賭博都是典型的“零和博弈”,在這種博弈之下,雙方會一直處于對抗狀態,直到得出結果,也就是分出勝負。
還有一種情況是博弈各方的得益總和始終是一個非零的固定數值,這種情況叫做“常和博弈”。例如遺產的分配就是一種常和博弈,各方的得益總和,也就是遺產的總數是不會改變的,不論各個博弈方采取什么樣的策略,獲得多少的得益。從一定程度上來說,“常和博弈”就是“零和博弈”的拓展,而“零和”就是“常和”中的一個特例。但是二者也有不同的地方,例如“常和博弈”的結果大多是某一方得益多,某一方得益少,所以博弈各方的對立并不會像“零和博弈”那樣“至死方休”,很容易在妥協中達到一種平衡。
博弈中的博弈方和得益是博弈過程中的兩個重要組成部分,也是博弈理論當中的重要因素。想要了解和掌握博弈論,就必須清楚這些基本概念,我們會通過后面的章節逐步了解博弈中的不同組成部分,以達到輕松掌握博弈論的目的。