第2章博弈是生活的一種基本形態

書名：博弈論（2024版）
作者名：王力哲編著
本章字數： 14073字
更新時間： 2024-07-09 11:13:16

博弈實際上是為了讓人們更加精細地活著，是為了讓人們更加精細地梳理生活，梳理人際關系，而這也是本書的一個宗旨，即博弈不是鉤心斗角的工具，不是爾虞我詐的方法，而是打造美好生活所需要的一個新概念。

為什么我們常常做出了最好的選擇，卻產生了最壞的結果？

《國富論》的作者亞當·斯密曾經說過這樣一段話：“我們的晚餐并不是來自屠夫、啤酒釀造者或點心師傅的善心，而是源于他們對自身利益的考慮……只關心他自己的安全、他自己的得益。他由一只看不見的手引導著，去提升他原本沒有想過的另一目標。他通過追求自己的利益，結果也提升了社會的利益，比他一心要提升社會利益還要有效。”

按照亞當·斯密的說法，個人在追求個人利益的過程中會對整個社會產生積極影響，會提升整體的利益。但事實并非如此，阿維納什·K.在《策略思維》中這樣說道：

“‘看不見的手’至多也就適用于一切都能標出價格的情況。但在經濟學以外的許多情況，甚至經濟學內部的許多情況中，人們并不會由于損害社會其他人的利益而被征收罰金，也不會由于造福其他人而得到獎勵。”

比如在日常生活中，人與人之間常常會存在利益上的糾紛，而這種糾紛和對決就需要人們在采取行動時，選擇最有利于自己的一種策略。但是恰恰是因為每個人都在爭取自身利益的最大化，使得很多時候彼此之間所做出的選擇會產生各種各樣的干擾。

通常在有關合作與競爭的體系中，彼此之間的選擇可能會產生很大的影響。比如兩個人一起合作，雙方都希望自己可以獲得更多的利益，但是在合作中本身就需要雙方做出協調和讓步，這樣才能達到步調一致以及實現整體利益的最大化，一旦有人過于看重個人的利益，那么另一方也會采取同樣的策略，這樣一來雙方就可能會互相干擾。最常見的現象是，一方希望以最小的成本投入獲得最大的利益，或者說自己可以少做點，而對方自然會多做一點；而另一方可能也會這么去想。這樣雙方可能都會在投入方面越來越吝嗇，愿意付出的精力也越來越少，從而影響到整體的利潤。

如果雙方是競爭對手的關系，那么在制定策略的時候，必定會以增加自身利益而消耗對方利益為主要目的。當一方想盡辦法從對方那兒獲取利益的時候，另一方也會擁有同樣的想法，也會采取同樣的策略。因此最終的結局是每一方都采取最消耗對方利益的方式，并直接導致兩敗俱傷的局面。

有時候人與人之間的關系并不是單純的合作或者競爭關系，雙方就某件事情或者某個問題進行溝通也會產生策略上的交鋒。比如一個高中生想讓父親給自己購買一臺iPad，所以他會努力學習，并且在期中考試的時候拿到了第一名，現在他可以以此作為與父親談判的資本，央求父親給他購買iPad，而且他認為父親一定會點頭同意的。從情感上來說，父親應該給予孩子一定的獎賞，但問題在于購買iPad雖然是孩子的愿望，但并不是父親的第一選擇，在父親看來，兒子的表現非常棒，當然最重要的是繼續將這種表現延續下去，而貿然獎勵iPad給兒子可能會影響到其正常的學習。

在這里，兒子和父親之間的想法出現了分歧，兒子認為自己應該獲得獎勵，但在父親看來，獎勵的時機和物品都不太合適，或許他更期待著兒子考上好大學之后再購買iPad。正因為如此，對這個高中生來說，通過提升學習成績來達到個人目的的方法并沒有起到作用。

兒子和父親在這里并不是一種競爭關系，但是雙方之間的確出現了意見上的沖突，而類似的沖突經常存在于上下級之間，因為雙方位置不同、看待問題的角度也不同，所以很容易會在各自的選擇上產生一些沖突。比如下級為了做出更大的業績，可能會鋌而走險，違背規則并做出一些冒險的舉動。站在領導的角度來說，更大的業績也是他們希望看到的，但是他們卻絕對不希望下屬脫離自己的控制或者違背指令來取得這些業績。在這種情況下，下級執行人員可能會通過一些非常規的手段獲得巨大的成功，但是仍舊遭到了懲罰。

有時候，下級又會做出一些相反的決策，比如他們固守上級領導的指示，覺得自己只要不違背規則，不超出行使職權的界限，那么就是最好的選擇，但他們可能因為不懂得變通而導致工作不能完成。而這個時候，上級領導可能更加看重執行的結果，至于執行的過程和方法，他們或許并不那么看重，這樣一來下級的選擇就要出錯。

如果對以上幾種現象進行分析，就會發現一個重要的問題，那就是人們在做出選擇或者某個決定的時候，通常都認為這樣的選擇對自己非常有利，會滿足自己的需求，但最后常常產生一些不那么合理的結果。從心理學的角度來說，一個人的期望值越高，失落的機會也就越大。或者正如墨菲定律所指出的那樣，只要某件事存在變壞或者導致災難的可能，那么無論這種可能性多小，最終都會發生。當人們做出選擇的時候，通常也會導致一些意外的發生，但是多數人可能會忽略這一點，并且認為自己的決策會是最好的，但恰恰是這種最好的選擇會產生一些負面影響。

事實上，對于多數人而言，他們自認為的“好選擇”往往只是針對個人利益滿足來說的。換句話說，人們只是按照自己的需求和立場來思考問題，來制定行動的策略和方法，但是任何人都不是孤立存在的，每個人都與身邊的其他人或多或少地產生聯系，這些聯系通常都是相互作用的結果。簡單來說，就是當某個人從自身的需求和立場出發制定某個策略時，或許并沒有考慮到這個策略可能會引發他人的反應，或者說當人們設想某一種理想的狀況時，沒有想過對方可能未必會采取完全迎合的態度，反言之，人們可以控制自己的想法和行動，但是別人始終是這些想法和行動中的不確定性因子。

如果人們能夠認識到這一點，就會意識到人生在很多時候都不會按照自己編寫的劇本去發展，一些自認為很不錯的選擇往往會成為束縛和限制自己的不良方案，尤其是當個人決策與他人的決策產生關聯并相互牽制時，人們在選擇時容易產生差錯，而這些差錯又會反過來影響人們的決策，使得他們常常陷入選擇上的困境。

囚徒困境：這不是一個人的游戲

上一節的最后談到了一個重要內容，當個人決策與他人的決策相互牽制時，人生總是不可避免地要面臨一些選擇上的困難，或者陷入選擇困境，而心理學家多年來一直都在積極研究這些困境的某些原理。1950年，美國蘭德公司的梅里爾·弗勒德和梅爾文·德雷希爾在研究之后擬定出了相關困境的理論，然后顧問艾伯特·塔克覺得有必要對這個理論進行更加簡單直白的闡述，所以舉了一個囚徒的例子，并命名為囚徒困境。

按照艾伯特·塔克的說法，囚徒困境的主要內容是兩個共謀的犯人被抓進監獄，并且分別關押在不同的房間里，這個時候他們無法進行有效溝通。而警察也沒有找到足夠的犯罪證據，所以分別對兩個犯人說：如果兩人都對自己的犯罪事實抵賴，那么將會各判刑1年；如果兩人都坦白自己的犯罪事實，每個人都會被判8年；如果兩人中一個坦白而另一個始終抵賴，那么坦白的會被直接放出去，而抵賴的被判10年。

當這個信息傳到犯人耳中時，兩個人都面臨著兩種選擇：坦白或者抵賴，與此同時，他們彼此之間都不清楚對方會采取什么樣的態度，因此雙方之間存在四種可能性的結果：第一，如果犯人A和犯人B都選擇坦白，那么雙方會被判8年；第二，如果犯人A選擇坦白，犯人B選擇抵賴，那么犯人A將會被釋放，而犯人B會加重罪名而被判10年；第三，犯人A選擇抵賴，而犯人B選擇坦白，此時犯人A要坐10年牢，而犯人B將會被立即釋放；第四，犯人A與犯人B都選擇抵賴，法院由于證據不足，只能判處兩人各1年刑期。

通過分析，兩個人實際上都意識到了一點，坦白才是更好的選擇，因為誰也不知道對方是否會采取認罪的態度。首先，如果同伙選擇抵賴，而自己坦白的話，那么自己會被直接放出去，而自己也抵賴的話會判1年，因此坦白比不坦白好；其次，如果同伙選擇坦白，而自己也坦白的話雖然被判8年，但是比起自己因為抵賴而被判10年，選擇坦白無疑更加合理。

經濟學家亞當·斯密就提出了“理性經濟人”的概念，在他看來，每一個人都是從自身利益最大化的角度來做出判斷和選擇，按照他的說法，兩個犯人雖然擁有各種各樣的策略，但是為了盡量保障自己的利益，他們在做某個決策時會盡量確保這個決策比其他決策帶來更高的收益，即保證自己的刑期最短。這是理性思考的一部分，而這種理性思考就會讓犯人采取主動坦白的姿態。

既然雙方都傾向于坦白，那么最終的結果有很大的可能就是雙方各被判刑8年。這個結果對于雙方來說是最好的結果嗎？顯然不是，因為如果雙方能夠選擇一起抵賴，那么兩個人實際上只需要坐1年牢，這才是對雙方更有利的結果，這個結果可以稱為帕累托最優。

帕累托最優是資源分配的一種理想狀態，通常人們對它的定義是這樣的：假定固有的一群人和可分配的資源，從一種分配狀態到另一種狀態的變化中，在沒有使任何人境況變壞的前提下，使得至少一個人變得更好。簡單來說，就是資源優化配置，以最小的成本和代價來獲得最大的收益，最初作為一個經濟學概念，這個最大的收益是指團隊的，而非個人的。或者也可以換一種更為明確的說法：一個人的決策在沒有使他人境況變壞的同時使自己的情況變得更好，那么這種狀態就達到了資源配置的最優化。

從囚徒困境這個案例來看，帕累托最優方案的實現往往很困難，由于雙方無法溝通，且擔心對方對自己做出不利的選擇，為保險起見，只好選擇坦白。從某種意義上來說，這種坦白意味著對對方的背叛而非合作，因為人們更希望另一方能夠采取抵賴的姿態，但另一方通常會堅定地選擇坦白。

囚徒困境中的“困境”主要來源于信息不明確可能會帶來的決策性失誤，如果雙方在進入監獄之前就約定都要矢口抵賴，那么最終的結果可能對彼此都有利，達到帕累托最優（有時候雙方即便有了口頭約定，一方也擔心另一方為了私利而背叛自己，這個時候，困境仍舊無法得到解除。因此一方必須在做出決策前準確了解對方的想法和決策，比如有人暗中傳遞信號）。而在信息被隔絕的情況下，每個人往往只會做出對自己更有利的那個選擇，因此雙方都會做出理性的判斷和選擇，而這種理性的選擇往往會產生壞結果，這就是第一節所談到的問題。將這個問題進行轉化，就是囚徒困境往往會影響帕累托最優的實現。

選擇合作還是背叛，永遠是生活的一個重要課題，如何將這個課題更好地解決往往很困難。有人提出多次重復囚徒困境，這樣一來，參與決策的人就有機會去“懲罰”和“報復”前一回合不采取合作姿態的同伴，從而逼迫雙方不斷采取合作的姿態，最終有效保證雙方的決策逐漸趨于帕累托最優。

不過，若是約定好重復的次數，那么情況可能會有所不同。這里可以以十局為例，按照正常的推論，犯人A第一次被犯人B背叛后，第二次他也會背叛自己的同伴作為回應。如果犯人B第一次就保持沉默，堅決不承認自己的罪行，那么雙方可能會建立起互信關系，接下來犯人A也會對同伴的“合作”態度表示迎合，這樣雙方就會因為共同合作而達到帕累托最優。在這里，保持沉默的態度是為了讓對方在下一局也能做出同樣的回應。

接下來的第三局、第四局可能都是如此，那么雙方會一直都采取這種合作態度嗎？情況可能并非如此，由于約定了重復的囚徒困境為十局，那么在第十局其中一方可能會采取背叛的姿態，因為這是他最后的機會來逃脫坐牢的命運了（假設對方采取抵賴的策略，而自己采取坦白的策略，那么自己就可以免于坐牢）。

對于犯人A和犯人B來說，他們都會猜測對方可能背叛自己，因此根據第十局的結果往前推，第九局時保持沉默與合作的態度已經毫無意義，因為在第九局的沉默原本就是為對方第十局做出沉默的策略作鋪墊的，既然雙方在第十局會采取背叛策略，那么兩人在第九局就沒有必要保持沉默。以此類推，第八局雙方也會背叛對方，第七局同樣會背叛對方，這樣一來，直到第一局，雙方都會采取相互背叛的策略。也就是說，在重復十局的囚徒困境中，每一局雙方都會以相互背叛的方式繼續下去。

可以說，想要通過重復囚徒困境的方式來打破相互背叛的僵局，實現帕累托最優，那么有一個前提條件就是不要給出具體的重復次數，因為一旦出現了次數上的限制，那就意味著每一個人都有機會通過背叛的方式來實現“不用坐牢”的目的。

納什均衡：利己主義者的優先策略

在囚徒困境中，“理性的犯人”為了確保自身的利益得到保障，會優先選擇坦白策略，而一旦雙方都選擇坦白策略，那么這個策略組合會成為一個相對穩定的狀態。原因很簡單，無論是犯人A還是犯人B都缺乏勇氣進行調整，此時任何一方如果改變策略（改口選擇抵賴），那就意味著自己將會置身于更加不利的局面（從8年牢獄之災變成10年），因為沒有人敢打包票說對方也會跟著自己選擇抵賴，對雙方來說，目前這種狀態是非常穩定的，并沒有改變和調整的必要。

而在囚徒困境的其他幾個策略組合中就不存在這個問題，比如當兩個犯人都采取抵賴的策略時，這個策略組合其實是不穩定的，因為其中一方完全可以通過坦白的方式讓自己獲得更多的好處。而當一個犯人抵賴，一個犯人坦白時，整個局面本身就是失衡的，其中一方必定會希望做出調整，這種調整會讓局面變得更好。

無論如何，當雙方都選擇背叛對方的時候，這種狀態對雙方似乎都是有利的，而這種相對均衡的狀態就是納什均衡。所謂納什均衡是指參與者形成了一種策略組合，在這個策略組合當中，任何參與者如果試圖單獨改變自己的策略都不會得到好處。換句話說，在制定某個策略后，雙方都不愿意做出調整。如果在一個策略組合上，一旦所有其他人都決定不改變自己的策略時，就沒有人會改變自己的策略，此時，這個策略組合就是一個納什均衡。納什均衡是約翰·福布斯·納什提出來的，他于1950年發表了《非合作博弈》的論文，之后又在《N人博弈中的均衡點》（1950）和《非合作博弈》（1951）這兩篇博士論文中進一步闡述了非合作博弈的論點，并漸漸形成了明確的理論。

聽起來或許非常復雜，但是納什均衡可以用一些非常生活化的例子來進行解釋。比如一對兄弟一起外出打獵，他們可以有多種打獵的方式，首先兩個人可以選擇打300斤的野豬，只不過需要雙方進行合作。其次，他們可以選擇抓兔子，兔子的總重量為200斤，雙方合作的話可以獲得200斤的兔子肉，即便分開行動，每個人也能獲得100斤的兔子肉。

在這個時候，雙方可能會存在這樣的組合策略：

第一種，兄弟二人選擇合作獵殺野豬，每人獲得150斤肉。

第二種，兄長更傾向于獵殺野豬，他覺得自己有能力單獨完成獵殺任務。而弟弟覺得獵殺野豬太冒險，還是抓兔子比較安全，因此選擇抓兔子，此時兄長的收獲為0，而弟弟會獲得100斤兔肉。

第三種，弟弟更傾向于獵殺野豬，他覺得自己有能力單獨完成獵殺任務。而兄長覺得獵殺野豬太冒險，還是抓兔子比較安全，因此選擇抓兔子，此時兄長的收獲為100斤兔肉，而弟弟的收獲為0。

第四種，兄弟二人都準備抓兔子，這個時候雙方分別可以獲得100斤兔肉。

在這些策略組合中，就存在兩個納什均衡，即第一種策略組合和第四種策略組合，在這兩個策略組合中，如果一方突然做出改變，那么就會失去原有的好處。比如在第一種策略組合中，如果弟弟選擇放棄獵殺野豬，而去捕捉兔子，那么收益就會從原先的150斤肉（野豬肉）變成100斤肉（兔肉）。在第四種策略組合中也是一樣，如果兄長突然決定獵殺野豬，那么他的收益將會從原先的100斤兔肉，直接降為0。

前面提到了亞當·斯密的“理性經濟人”概念和理論，按照這一理論，在市場經濟條件下，人們都會從利己的角度出發，并最終在整體上形成利他的效果（如果每個人都保持理性，整體就會達到一個相對滿意的狀態，即整體福利的提升），而納什均衡雖然是由個人的理性行為引起的，但是它卻指出了理性經濟人理論的悖論，那就是當人們試圖從利己的角度出發時，結果可能是損人不利己，這樣對雙方都沒有任何好處。或者可以說“納什均衡”本身可能就不是一個“理性”的狀態。

這一點在“囚徒困境”中表現得非常明顯，在囚徒困境中，納什均衡只有一個，那就是雙方都選擇背叛對方而積極坦白罪行，這是唯一穩定的策略。但是這個納什均衡并不是最優的結果，因為只有當雙方都采取抵賴措施時，才會達到帕累托最優。

某種意義上來說，納什均衡并非最優或者最理性的，但卻是在面對不可控的狀況時（信息不明確），自己所能獲得的最好選擇，可以說，納什均衡尋求的是個人的最優解，對個人而言，這是一種穩定的均衡。

納什均衡理論的出現直接促進了博弈理論的產生，可以說它奠定了現代主流博弈理論和經濟理論的根本基礎，經濟學家克雷普斯在《博弈論和經濟建模》一書的引言中這樣說道：“在過去的一二十年內，經濟學在方法論以及語言、概念等方面，經歷了一場溫和的革命，非合作博弈理論已經成為范式的中心……在經濟學或者與經濟學原理相關的金融、會計、營銷和政治科學等學科中，現在人們已經很難找到不懂納什均衡能夠‘消費’近期文獻的領域。”

事實上，在學術界，人們認為博弈論萌芽于20世紀20年代，而創立的標志則是馮·諾依曼和奧·摩根斯坦在1944年出版的《博弈論與經濟行為》這部著作，這兩個人大致提出了博弈論的基本概念、二人零和博弈以及合作博弈等內容。

不過由于納什均衡是一種非合作博弈狀態，而這種非合作博弈理論是目前博弈理論中應用最廣泛的理論，因此許多人認為納什均衡理論的提出才為博弈論的發展開辟了更為廣闊的道路，其中的均衡理念成為了博弈論的基本概念。可以說，在整個博弈論的發展歷程中，納什均衡都是一個重要的組成部分，它對博弈論的完善和發展起到了非常重要的作用。

經典博弈論和行為博弈論

博弈論在發展過程中，經歷了一些重要的變化，最常見的就是從經典博弈論發展成為行為博弈論，這種發展表明了博弈論的不斷完善，不斷貼近現實生活。

經典博弈論假設參與人是理性且完全關注自身利益的，因此他們的行為模式更多地停留在個人利益的基礎上。它與信息經濟學一樣，都是以“理性人”為理論基礎的，通過一個個精美的數學模型搭建起公理化的完美自洽的理論體系。在他們看來，理性人擁有一些典型的行為特征：會追求個人利益的最大化，不會信任其他人。

但心理學和行為科學的研究發現，人們常常會表現出很多與此假設相悖的奇特行為。比如在一個團隊內部，領導者會依據每個人的工作能力、貢獻以及與自己的親疏關系來進行利益分配，按照經典博弈論的說法，團隊內部的每個人都是理性人，都會為自己的利益而努力，但是一些人會有公平心理，認為團隊內部應該進行更平等的分配，因此會主動為那些利益受損的弱勢者積極發聲。

心理學和行為經濟學的研究結果表明，人們在做出經濟決策時會受到思考成本（人類認知能力有著心理的臨界極限）、激動和經驗等心理因素的影響，從而存在系統的推理誤差，這些誤差會影響人們的判斷。行為博弈學家認為現行的社會、制度、經濟和生活環境都會影響人與人之間的信任，因此個人的社會偏好應該納入到博弈論之中。

為了驗證這一點，心理學家和行為經濟學家特意做了一個實驗。

他們招募了一批博弈者，然后將他們安置在計算機實驗室中，參與實驗的人每人可以獲得10元的出場費，每兩個人分成一組，彼此都不認識也不會見面，只是通過計算機建立聯系。小組中的成員A可以將任意數額的錢（0～10元）借給成員B，而不管A付出多少，B都會收到3倍的金額。比如說A愿意借出5元，那么B將會獲得5×3+10=25元的支付。接下來B需要決定是否還錢給A以及應該還多少。

反過來說，B愿意借錢給A的話，A也同樣會收到3倍的金額。按照傳統博弈論，如果雙方進行一次性的博弈，那么A和B都不會借錢給對方，因此雙方的收益只有10元。但是經過實驗，行為學家發現一半的博弈者會借給對方錢，而其中四分之三的人會順利收到對方的還款。其中，如果一個人從另外一個人手中借到的錢越多，那么還錢也會越多。

這個實驗佐證了心理學家和行為學家的理論，即人們并非都是自私自利的，作為一種高度社會化的動物，人們更加懂得如何維持好人際關系，因此會關注和分析對方的情緒和反應，并以此作為制定策略的重要依據。有時候這種自動的社會化反應機制產生作用時，人們甚至都無法意識到，但它還是會發生作用。

行為博弈論的觀點更加符合“社會人”的設定，即每個人都是社會中的一分子，而整個社會是一個大群體，社會中的每一個人無論是合作還是競爭都是相互聯系、相互影響的，這種聯系就決定了每個人都不可能安全按照自己的意志行事，不能夠自私自利地活在自己的主張中。有時候在做出決定或者表現出某種行為時，需要看一看他人的反應，需要適當為別人著想，并根據他人的反應或者他人有可能出現的反應修改自己的行為。可以說，在行為博弈過程中，參與者不僅受制于自身主觀預期和行為，也容易受制于其他類型參與者行為的影響。這種博弈模式實際上就類似于一個動態的相互反射且不斷發展的過程，一方的行為會對其他人產生影響，而其他人的行為也會對個人行為產生影響，整個過程充滿了各種不確定性因素。

實際上，行為博弈論是行為經濟學的一個重要分支，而行為經濟學是經濟學方法中的一種，它提出并引用了弱化理性假設的理論。這種弱化理性的假設通常源于社會法則和道德約束，就像前面提到的借錢一樣，將錢借給別人的人需要承擔很大的風險，因為對方不一定會還（考慮到如今出現的民間非法融資和民間借貸風險），而堅持借錢的做法無疑是出于一種信任，即借出錢的人堅信對方會還錢給自己，而且會對自己的善舉充滿感激。或者說借出錢的人堅信對方會保留做人最基本的道德準則，會受到良心的約束而還錢。

行為博弈論和公平、對公平的偏好有關，那么有關公平的偏好從何而來？行為學家提出了一種比較流行的觀點：人類的祖先在進化過程中，大腦機制中形成了一種適應，使得人們受到外力擺布時產生憤怒的情緒，這一點在認知和情緒系統的互動中也可能會出現。在當時小范圍的生活環境中，人們意識到憤怒具有一定的生存價值，可以帶來公平。另一種說法是人們會根據血緣關系的親疏或者和陌生人進行交易時的親和程度，產生不同標準的公平，而且不同文化也會產生不同的標準，并將這些標準沿襲下來。

無論如何，人們對于公平的偏好決定了博弈策略的改變，也使得人們免于在追求個人利益最大化的同時陷入集體利益最小化的尷尬局面，而這正是博弈達到均衡狀態的最大障礙。

了解博弈的類型，才能更好地了解博弈的結構

作為一種心理戰術，博弈的形式多種多樣，而不同形式的博弈往往會產生不同的博弈效果，也會對個人的生活產生不同的影響。那么博弈通常是怎樣進行劃分的呢？

博弈從結果上來說可以分為負和博弈、零和博弈、正和博弈三種基本類型，這也是人們最常接觸的劃分方式，或者說是一種最常規的劃分方式。

負和博弈是指雙方在博弈中由于存在不可協調的沖突和矛盾，或者雙方沒有達成統一，以至于彼此互不相讓，這個時候雙方的策略只會給自己帶來損失，這種損失比各自的策略帶來的利益更多，從而造成兩敗俱傷的局面。簡單來說，這一博弈策略就是“損人不利己”。

零和博弈指參與博弈的各方，在嚴格的競爭條件下，一方獲得收益的同時必然意味著另一方遭受損失，博弈各方的收益和損失相加總和永遠為零，并且雙方不存在合作的可能。零和博弈可以看成是個人的收益建立在他人的損失基礎上，個人的幸福建立在他人的不幸基礎上，它的策略就是“利己損人”。

正和博弈（合作博弈）是指博弈雙方的利益都有所增加，或者至少是一方的利益增加，而另一方的利益不受損害，但利益從整體上來說得到了增加。這是一個“利人利己”的雙贏局面或者至少是“利己不損人”的策略。

想要了解這三種博弈的概念以及彼此之間的區別，可以以夫妻一同看電視為例子：一對夫妻在看電視，可是丈夫喜歡看體育頻道，妻子卻喜歡看肥皂劇，在電視只有一個的情況下，丈夫看體育頻道就意味著妻子的喜好無法得到滿足，反過來說，一旦妻子看上了肥皂劇，丈夫就不得不做出犧牲。假設當丈夫當晚如愿看到體育頻道時，獲得的滿足為1，如果當晚不能看到自己喜歡的體育頻道，得分為-1；妻子當晚如愿收看肥皂劇時獲得的滿足為1，反之為-1。

如果丈夫和妻子約定當晚只有一人可以觀看電視，另一方要么陪著看電視，要么看書。雙方可以剪刀石頭布的方式決定誰看電視，無論結果出來怎么樣，有一個人必然會得到滿足，分數為1，另一個人則感到失落，得分為-1，這時候雙方的滿足感之和為0，而雙方的博弈就是零和博弈。

如果丈夫和妻子當晚因為爭奪遙控器而發生了爭吵，以至于兩個人互不相讓，丈夫奪走了遙控器，而妻子干脆將電視上的電線插頭拔掉，這個時候兩個人誰也看不成電視，雙方通過電視獲得的滿足為-2。或者兩個人因為斗氣將電視切換到動物世界頻道上，由于它和體育頻道、肥皂劇都無關，因此兩個人的滿足也為-2。這種兩敗俱傷的局面就是負和博弈。

如果丈夫和妻子都是非常包容的人，他們都表示當天晚上會將觀看電視的機會讓給對方，由于都不忍心冷落對方，雙方約定輪流觀看電視，丈夫先看30分鐘的體育頻道，然后電視頻道切換到肥皂劇上，妻子觀看30分鐘，之后再次切換。這樣一來，雙方都可以觀看到自己喜歡的電視節目，那么雙方當晚都可以獲得滿足。這個時候，雙方的博弈就屬于正和博弈。

企業與企業之間做生意的時候也常常會出現這樣三種博弈方式，當企業之間因為競爭關系和利益分配問題產生糾紛，如果雙方都不打算妥協和讓步，那么關系可能越鬧越僵，最后雙方決定擴大競爭，完全變成相互攻擊的對手，這樣就可能會導致雙方在競爭中兩敗俱傷。這時候，雙方的博弈是負和博弈。

當企業之間保持正常的交往策略，雙方約定了一些公平的競爭方法，可是為了獲得私利，其中一方使用計謀給對方設置了陷阱，結果導致對方損失了一大筆錢，這個時候掙錢的一方所掙的錢，剛好是另一方損失的錢，雙方的博弈關系就是零和博弈。

如果兩家企業都具備戰略目光，意識到雙方繼續保持競爭的態勢，或者繼續保持單獨作戰的理念，恐怕會在市場上失去競爭力，最好的方法就是雙方進行合作，通過合作來提升各自的競爭力，這樣一來，雙方的策略就促成了正和博弈。

除了劃分為負和博弈、零和博弈、正和博弈之外，還可以將其劃分為靜態博弈和動態博弈，完全信息博弈和不完全信息博弈。靜態博弈一般是指同時決策或者同時行動的博弈，有時候博弈雙方會采取先后行動，但是彼此都不了解對方的決策，這也是靜態博弈。而決策或行動有先后順序之分，且后者可以觀察前者的行動并做出相應的選擇，這種博弈模式稱為動態博弈。

完全信息博弈是指每一位參與者都擁有所有其他參與者的特征、策略及得益函數等方面的準確信息的博弈。不完全信息博弈是指參與者對對手的了解不夠精確，也沒有掌握確切的信息。

這些不同的博弈可以形成四種常見的博弈類型，即不完全信息靜態博弈、不完全信息動態博弈、完全信息靜態博弈、完全信息動態博弈。

不完全信息靜態博弈是指至少某一個局中人不完全了解另一個局中人的特征，即不知道某一參與者的真實類型，但是知道每一種類型出現的概率。

不完全信息動態博弈是指在動態博弈中，行動有先后次序，在不完全信息條件下，參與者知道其他參與者有哪幾種類型以及各種類型出現的概率，但是并不知道其他參與者具體屬于哪一種類型。不過，后行動者可以通過觀察先行動者的行為來獲得有關先行動者的信息，以便證實或修正自己采取的行動。

完全信息靜態博弈是指參與者同時選擇行動，或行動有先后但后行者并不知道先行者采取了什么具體行動；與此同時，每個參與者對其他所有參與者的特征、策略空間及支付函數有準確的認識。

完全信息動態博弈參與者的行動有先后順序，后行者能夠觀察到先行者所選擇的行動；且每個參與者對其他所有參與者的特征、策略空間及支付函數有準確的認識。

這四種博弈中談到了一個很重要的因素，那就是信息，無論是哪一種博弈，決定其最終結果的可能就是信息，信息量的多少往往會對博弈雙方產生重要的影響。

內容延伸博弈有時是一場控制與反控制的游戲

許多人對博弈并不了解，甚至會出現諸多的誤解，認為博弈就是一種利益獲取的工具，它具有自私的特性，但真正的博弈具有更高維度的思想和境界。事實上，獲取利益的方式可以有很多種，人們也可以表現得更加直接、更加粗魯、更加自私自利，可是這些方法都不像博弈一樣具有更深的內涵，盡管博弈過程中也存在爭斗，存在利益的劃分，也存在壓制他人的欲望，但總體上來說，博弈不過是一場和諧的游戲。

而想要了解博弈的本質，完全可以從生活中的一些小例子進行分析：

羅小姐希望閨密可以在明天（周末）早上6點開車送她去車站，她可以直接向閨密提出這個請求：“明天早上5點，你可以送我去車站嗎？我要去那兒辦點事。”

閨密在聽到這個請求后，會有什么樣的反應呢？也許她會感到為難，畢竟從羅小姐家中到車站要花費1個多小時，而從自己家到羅小姐家中還要30分鐘，這樣差不多要花費2個小時，往返一趟將要花費4個小時，這樣的苦差事的確很折磨人。面對這樣一道難題，閨密或許會直接找一個借口拒絕：“對不起，明天早上我要早點去老家，所以不能送你去車站了。”

羅小姐如果是一個聰明人，那么從一開始就不能表現得太過于理所當然，為了說服閨密，她需要表現得更加委婉一些，態度應該更加誠懇一些，需要將自己的難處表現出來。正因為如此，她或許可以這樣說：“明天早上5點，你有空的話，可以送我去車站嗎？我知道這很為難，天那么早還那么冷，但除了找你我實在想不到更好的辦法了，如果不能準時到達，老板估計又會找我麻煩了。”

這是一出比較出色的苦肉計，低姿態加上示弱，往往更容易引起對方的同情，閨密面對這樣的請求很難無動于衷，盡管她還是會覺得為難，可是羅小姐的攻心戰術已經在慢慢起作用了。

羅小姐同樣也可以運用其他的方法來提出請求，如果她愿意表現得更隱蔽一些，那么一開始就不要試圖去要求對方替自己做什么，而應當設法引導對方做出積極的回應。因此，羅小姐完全可以這樣開始自己的談話：“明天就是周末，你有什么安排嗎？”

“沒有啊，我這樣的閑人還能有什么安排。”

“那你能不能送我去車站？我有點事要出差。”

“這個啊，嗯，好吧，我想自己應該也沒什么事，你什么時候去車站。”

“早上7點，這有點早，而且天氣還那么冷，我真的是不好意思向你開口。”

“7點的確有點早，但也沒什么，我會準時送你過去的。”

“哦，不是，我希望你早上5點就送我過去。”

“5點？你不是說7點出門嗎？怎么還要那么早呢？”

“原本是7點出門也沒事，但問題在于我還要在前往車站的中途給一位客戶送一份文件，這個客戶準備坐6點的飛機離開這兒，因此我必須在他上飛機之前將東西送過去。”

“是這樣啊，那……那……那么好吧，既然都已經答應你了，我會早點趕過來接你。”

在這里，羅小姐兩次都改變了策略，第一次，她沒有直接說明自己要做什么，她的問題并不具備“進攻性”（希望對方怎么樣，或者要求對方怎么樣），閨密無法感知到羅小姐想要干什么，因此也就實話實說，這樣就為羅小姐的請求奠定了基礎。第二次改變策略是，羅小姐根本沒有明說要5點鐘起床，而是說自己7點要去車站，這使得她輕易贏得了閨密的承諾，而正是因為這個承諾才讓一件為難的事情順利得到解決。

在這三種對話模式中，第一種最為直白，但是效果可能最差；第二種比較內斂，容易引發對方的同情，說服的效果往往不錯；第三種模式最為聰明，羅小姐變成了一位非常出色的操縱者，她提出了一個封閉式的問題“明天有什么安排”，而不是開放式的問題“明天有空送我去車站嗎”，而且她在提出問題之前就已經設定好了對方的回答以及自己應該做出的回應，因此可以輕松掌控對方的思維與心理。

在生活中，利用這一類心理戰術，人們通常可以輕松控制他人的大腦，而這種控制正是博弈的一個精髓。它和心機、腹黑等并不一樣，心機和腹黑的人往往利益傾向性非常明顯，習慣了通過犧牲他人的利益來滿足自己，而信息限制帶來的大腦控制更多時候只是一種溫和的策略，盡管被控制的人可能會陷入一個尷尬的處境，并且容易產生一些不愉快的體驗，操縱者刻意隱藏和混亂了信息，導致被控制的人產生了錯誤的判斷，有時候甚至連他們也不清楚自己是如何被繞進去的，但博弈最終的目的是盡可能達到一種均衡。

羅小姐雖然贏得了閨密的承諾，但是她不能像沒事發生一樣，為了確保自己的行為不會影響到彼此的感情，她需要給予閨密一些回報：“真是不好意思了，這樣吧，下次我請你吃飯。”無論對方接受與否，這樣的“回饋”或多或少都會緩和略顯尷尬的關系。

不過，事情有時候也會發展到另一面，那就是閨密對羅小姐的反控制，反控制通常源于對壓迫性的反抗，比如閨密對羅小姐彎彎繞繞的請求不太舒服，或者她確實覺得在早上5點起床（而且還是大冷天）不太方便，她更希望推掉這個麻煩，但是為了不傷害感情（這也是達到平衡的需求），她需要盡快了解對方的動機，并做出反制措施。

第一種模式：

羅小姐：“明天就是周末，你有什么安排嗎？”

閨密：“你不會又想著出去旅游了吧？你可真是舒坦，我就沒有這樣的好命。”

羅小姐：“怎么了？你還要加班？或者還有什么重要的事情要做？”

閨密：“是啊，整個周末都要泡湯了。”

羅小姐：“這樣啊，我原本還想著讓你明天早上開車送我去車站，我有點事。”

閨密：“哦，那我恐怕是愛莫能助了。”

在這個模式中，當羅小姐提出問題后，閨密開始保持警覺，意識到對方可能有求于自己，或者雙方會有什么活動，在不清楚對方的動機時，她先賣一個關子讓自己占據主動位置，這樣就可以從容應對對方的出招了。

第二種模式：

羅小姐：“明天就是周末，你有什么安排嗎？”

閨密：“沒有啊，我這樣的人，現在還能有什么安排。”

羅小姐：“那你能不能送我去車站，我有點事要出差。”

閨密：“這個啊，嗯，沒問題，你什么時候去車站？我看看能不能安排好時間。”

羅小姐：“怎么了，你還有其他事嗎？”

閨密：“也沒什么大事，明天是周末，我讓水管修理工來家里幫忙修管道，因為下周我要出差，那時候就沒時間處理這些事了。”

羅小姐：“那個修理工什么時候來，他可不可以晚點過去？”

閨密：“這個不好說，沒準很早。”

羅小姐：“這樣啊，我是早上5點的車，路上來回要幾個小時，不知道時間上來不來得及。”

閨密：“這個就不好說了，你晚點去要緊嗎？要不然我晚點送你去？”

羅小姐：“哦，那我還是再問問別人吧！”

在第二個模式中，閨密雖然沒有在第一時間意識到羅小姐的想法，但是卻在答應對方的時候留了余地，并直接打亂了羅小姐原有的計劃，這樣在雙方交流的過程中，閨密始終沒有被羅小姐帶入她的節奏中，并最終巧妙地拒絕了對方的請求。在這個反制措施中，雙方依然沒有產生任何摩擦，彼此之間保持了一個相對和諧的、平衡的局面，因此可以說讓整個博弈非常成功和精彩。

生活中常常會出現這一類讓人感到為難，不好意思提出請求而且又不好意思拒絕的事情。在面對這一類事情時，請求者擔心對方會拒絕，而被請求的一方又擔心自己會增加不必要的麻煩，因此彼此都會小心翼翼地試探對方，避免弄巧成拙。

本書所談論的話題非常廣泛，但是將所有的內容歸結起來，本質上就是“控制”與“反控制”，無論是愛情、婚姻、職場、商界競爭、軍事，還是日常的人際交往，都體現出了這兩種元素。也就是說，人們在日常生活中，只要與人發生聯系，與人進行接觸，或多或少都存在大腦被入侵以及抵抗入侵的情況，而無論是入侵下的控制還是反控制，都是為了創造一種平衡的狀態。從這一角度來看，博弈實際上是為了讓人們更加精細地活著，是為了讓人們更加精細地梳理生活，梳理人際關系，而這也是本書的一個宗旨，即博弈不是鉤心斗角的工具，不是爾虞我詐的方法，而是打造美好生活所需要的一個新概念。

官术网_书友最值得收藏!

博弈論（2024版）

第2章 博弈是生活的一種基本形態

第2章博弈是生活的一種基本形態