- 博弈智慧:權(quán)衡利弊,追求最優(yōu)結(jié)果的一門學(xué)問
- 王登舉
- 1953字
- 2025-08-20 15:15:27
5. 納什均衡:多個博弈均衡點下的策略選擇
在博弈的過程中,我們常常會遇到難以做決策的情況。這時,不妨用博弈論中的“納什均衡”概念作為參考,做出對我們較為有利的決策。
什么是納什均衡呢?納什均衡,又稱為非合作博弈均衡,是由數(shù)學(xué)博士約翰·納什提出的博弈術(shù)語。它指的是,在一場雙方或多方的博弈過程中,找到一個對所有參與者均有好處的最優(yōu)策略。無論哪一方單獨改變這個策略,都會損害所有人的共同利益,沒有一方能夠從中獲得更多的好處。
為了保障各方的最大利益不受損害,所有參與者需要達成共識,執(zhí)行這一最優(yōu)策略,實現(xiàn)共贏。如果各方處于對抗?fàn)顟B(tài),必然會損害共同利益。為了改變這一“共輸”局面,需要有人站出來,尋找新的方案,以確保共同利益處于均衡狀態(tài)。
在生活中,我們隨處可見納什均衡的例子。最常見的是,在某一處商業(yè)街,開了一家服裝店之后,第二家、第三家也會相繼開張。這幾家店,明明是競爭關(guān)系,卻聚集在一起,共享客源。因為只有足夠多的服裝店,才能吸引足夠多的顧客,每家店分到的客源也會相對增加。
想要更準(zhǔn)確地理解納什均衡,我們可以舉一個更詳細(xì)的例子。假設(shè)一個商家要在一個小鎮(zhèn)上開兩家超市,這兩家超市的商品和價格都是一樣的,唯一不同的就是地理位置。那么,這兩家店應(yīng)該分別開在什么地方,才能保證最大的收益呢?
假設(shè)小鎮(zhèn)上的居民平均分布在各處,那么,兩家超市為了獲得盡可能多的客源,都想要往中間地段靠攏,誰離開中間地段,都可能喪失一部分客源。最終的結(jié)果是,兩家超市都開在中間地段,才能保證彼此的最大利益。那么,中間地段這個最佳位置,就是納什均衡點。
納什均衡分為純策略納什均衡和混合策略納什均衡:純策略納什均衡強調(diào)確定地選擇某一策略,混合策略納什均衡則強調(diào)以某一概率隨機地選擇某一行動。
比如,在囚徒困境的例子中,如果兩個犯人選擇各自的最優(yōu)策略——坦白,那么坦白就是純策略;而在我們玩“剪刀石頭布”游戲的時候,隨意地出剪刀、石頭、布,就是混合策略。
在博弈中,存在以下兩種情況。第一種情況是,參與者在制定策略之前,并沒有商量好使用什么策略。各方都選擇了對自己來說最優(yōu)的策略,而不考慮其他方的利益。然而,雙方或多方在追求自身利益的同時,恰好達到了共同利益,最終形成了納什均衡。
第二種情況是,通過雙方或多方互相約定或互相依存的博弈,保證共同利益的最大化,從而形成納什均衡。在這種情況下,參與者在做決策時,不僅要考慮自身利益,還需要根據(jù)其他參與者的策略來決定自己的策略。
在一場博弈中,往往存在多個納什均衡,既有共同受益的好的均衡,又有雙方利益受損的壞的均衡。在“囚徒困境”的例子中,如果犯人雙方選擇坦白策略,那么他們每個人需要坐8年牢,對他們來說,這是壞的均衡。如果雙方選擇不坦白,他們都只需要坐1年牢,都得到了最大利益,那么這個結(jié)果對他們來說,就是好的均衡。
值得注意的是,好均衡與壞均衡之間并非固定不變,它們可以相互轉(zhuǎn)換。在納什均衡中,各方需要根據(jù)其他方的策略變化隨時選擇最優(yōu)的策略,才能為自己爭取到更多的利益。下面這個故事恰好說明了這一原則。
古時,在楚國和魏國的交界處,雙方都種著瓜。某年,恰逢天旱嚴(yán)重。魏國人因為勤于澆水,把瓜苗培育得健康茂盛。而楚國人因為懶散,只能種出一片毫無生機的枯黃瓜苗。于是,他們心生忌妒,在半夜偷偷拔掉了魏國人的瓜苗。
魏國人十分憤怒,決定報復(fù)楚國人。這時,深謀遠(yuǎn)慮的縣令阻止了他們,因為他知道,冤冤相報沒有盡頭,最終只會使兩國的瓜苗都遭到破壞,無法收獲勝利的果實。于是,他主張人們以德報怨,半夜幫楚國灌溉瓜田。
魏國人聽從了縣令的建議并實施后,果然感化了楚國人。楚國人心懷感動和愧疚,對魏國人表達歉意。從此,兩國人互相幫助,和平相處,最終都收獲了豐盛的瓜果。
在這個故事中,存在兩個均衡。一個是好的均衡:大家都收獲了瓜果;另一個是壞的均衡:大家的瓜苗都遭到了破壞,誰也別想得到一個瓜。當(dāng)楚國人選擇了破壞瓜苗這一策略以求心理平衡后,如果魏國人采取“以怨報怨”的策略,則可能導(dǎo)致壞的結(jié)果,也就是壞均衡。實際上,他們采取了“以德報怨”的策略,最終得到了好的結(jié)果,也就是好均衡。
由此可見,好均衡與壞均衡之間的轉(zhuǎn)換,取決于雙方的決策,以及一方?jīng)Q策變動后,另一方如何針對性地制定更優(yōu)的決策,最終達成好的均衡。
當(dāng)然,在不同的情況下,“以德報怨”這一策略未必是最好的選擇。具體問題需要具體分析。魏國人之所以選擇“以德報怨”的策略,可能源于他們對楚國人的了解,認(rèn)為對方一定能夠被自己的善行感化,因此才采取這一策略。
如果兩國的矛盾已經(jīng)到了水火不容的地步,那么“以德報怨”這一策略不僅不會得到對方的感激,反而可能被視為懦弱,從而遭受更大的惡意,無法達到良好的均衡。在博弈的過程中,我們一定要靈活運用納什均衡的知識,選擇對自己最有利或?qū)Υ蠹叶加欣牟呗浴?/p>