官术网_书友最值得收藏!

不要讓我們的對手有跡可循

有個成語叫做“按圖索驥”,其意思便是按照一定的線索尋找自己的目標。在博弈分析的時候,按圖索驥便是一種很好的方式,依據對方的得益推斷出對方的策略方向,再依據對方的能力和理性推斷出對方的策略范圍。最后,根據對方的策略方向和范圍很容易就可以推測出對方的策略選擇。

上述內容其實就是尋找納什均衡的一種方式,雖然這是一種很好的博弈分析方式,但遺憾的是并不是所有的博弈都存在納什均衡。當我們遇到不存在納什均衡的博弈時,之前的分析方法便無法明確地給出建議,那么此時應該怎么做呢?回想一下,之前的分析都是建立在“理性經濟人”的假設基礎之上,所以每個博弈方都可以最大限度地搜集自己所需要的信息,但同時我們也知道實際生活中是不可能出現這種狀況的,理論和實際的差別就提供了解決問題的方向——信息。

兩個人在猜硬幣,只要猜對對方扣在手中的硬幣是哪一面向上,就可以取得勝利。如果單純從策略方面分析,兩人的策略都是兩種:正面或者反面。不論雙方選擇哪一種策略,都無法保證自己的勝利,這場博弈完全沒有明確的、可預測的結果,因為雙方并不存在可以形成納什均衡的策略組合。那么,是否就意味著這場博弈我們完全沒有展開分析的可能,只能胡亂地決策呢?顯然不是。雖然這里的分析對于預測結果沒有什么意義,但是卻引出了一個博弈當中十分重要的原則:絕對不能讓自己的策略被對方預先了解或者猜到。就拿上面的猜硬幣來說,如果猜的一方知道了扣的一方的策略,那么他就會準備好相應的答案。同樣如果扣的一方知道了猜的一方要怎么回答,那么他也可以故意放成相反的樣子,這樣就能保證自己的勝利。這是博弈當中必須遵守的原則,除非我們一門心思想輸。

由此我們可以初步推出,必須要隱藏自己的策略選擇,最佳的方式就是在扣硬幣的時候變得沒有規律。如果我們總是一正一反或者說兩正一反這樣帶有規律性地扣硬幣,那么一旦對方摸清了我們的規律,就可以有針對性地制定策略,從而讓我們輸得一塌糊涂。所以,我們必須讓正反面的出現變得毫無規律。但是這樣做就足夠了嗎?當然不行。

還記得上初中時看不懂完形填空的時候是怎么處理的嗎?就是整道題的所有選擇都選同一個選項,所以經常會在試卷上看到一連串的a或者一連串的b。那時候我們不懂別的,只知道這樣做最少也可以蒙對四分之一。這又說明了一個問題,雖然我們的正反面出現變得沒規律了,但是總的來說正面出現的次數要大于反面出現的次數,那么如果對方一直選擇正面的話,自然也會贏多輸少。在重復博弈當中,博弈的得益是最終得益的總和,所以輸多贏少的我們自然是這場博弈的輸家。因此為了讓我們的對手不至于蒙出好運氣來,最佳的選擇就是在沒有規律的基礎上讓正反兩面出現的次數一致,這樣對方就無法利用我們的偏好來贏得勝利。同時作為猜硬幣的一方,也可以采取同樣的策略,使得不論對方做什么樣的選擇,都可以保證自己不輸。如果雙方都采取同樣的策略,那么就會形成一種平衡,我們可以姑且稱之為“混合策略納什均衡”。

所謂的混合策略,就是不同策略出現的時間隨機分布。如果出現的次數達到一定的平衡,就是我們所說的混合策略納什均衡。相對而言,之前在動態或者靜態博弈當中的策略就可以被稱作是純策略,而之前的那種均衡也可以被稱作純策略納什均衡。如果在一場博弈當中找不到純策略納什均衡的話,找到混合策略納什均衡也是一樣有效的。

因為博弈論而獲得1994年諾貝爾經濟學獎的塞爾頓教授在一次演講中講過一個小偷和守衛的例子:

小偷想要去偷竊一個倉庫,如果守衛正好睡著了,那么就會偷竊成功,但守衛會被解雇;如果守衛沒有睡著,那么他就會因為偷竊失敗而被抓,小偷就會坐牢。這里面小偷有兩種策略選擇——“偷,不偷”,而守衛也有兩種策略選擇——“睡,不睡”。

如果小偷選擇“不偷”,守衛也選擇“不睡”,那么兩者相安無事,但是守衛卻失去了一次偷懶的機會。而如果小偷選擇“不偷”,守衛選擇了“睡”,那么小偷則失去了一次可以得益的機會。所以兩者在制定策略的時候一定要考慮到對方的選擇。當小偷選擇“偷”的時候,守衛最佳的選擇就是“不睡”,因為如果被偷了,他就會失去工作。而守衛選擇“不睡”的時候,小偷的最佳選擇就是“不偷”,不偷相安無事,偷了就得去坐牢。而小偷選擇“不偷”的時候,守衛的最佳選擇肯定是“睡”,反正閑著也是閑著。拋開道德之類的影響因素之后,無論從哪里開始,都會逐漸形成這樣一個循環。但是小偷和守衛都是有限理性的人,所以我們不能期待這么一個循環的出現來證明自己的推斷。

事實上,當小偷決定一段時間“不偷”之后,守衛就會逐漸放松警惕,從而天天選擇“睡覺”,這時候小偷就可以抓住機會去“偷”。而當小偷經常光顧倉庫,新來的守衛得知之前守衛的下場之后,就會天天選擇“不睡”,這樣小偷就只能選擇“不偷”。至于為什么不是“被抓”,是因為小偷具有一項特權,那就是決定什么時候出現。小偷不出現,守衛即便知道小偷的存在,也無可奈何。

在這場博弈當中,雙方最重要的就是不能讓對方知道自己的策略選擇。所以對于知道小偷存在的守衛,最佳的辦法就是假裝“睡覺”,然后引出小偷來“偷”,這樣就可以一勞永逸。這雖然不符合博弈理論,但卻不失為一種在博弈中取得勝利的辦法。在博弈理論當中,守衛在明知道小偷會來偷東西的時候睡覺,顯然是一種下策,而下策是絕對沒有人會去選擇的。如果我們把“假裝睡覺”算在策略當中,那么按照理論來說,小偷也可以采用“假裝偷”的策略來應對,這就會讓我們的分析陷入一個死胡同。所以對理論的應用要靈活多變,而不是生搬硬套。

小偷和守衛這個模型主要解決的就是管理問題,管理者和被管理者就可以看做是守衛和小偷。把之前小偷被抓記作得益a,成功偷到東西記作得益x,守衛被處罰記作得益b,睡覺而沒有被罰記作得益y。為了解決小偷偷東西和守衛睡懶覺的問題,只需要加大得益a和得益b就可以了。當得益a變大的時候,小偷就會得出a+x是負數的結論,這時候小偷的策略傾向就會選擇“不偷”。小偷不偷的結果就是守衛的工作變輕松,也就意味著管理者的工作變得輕松了,同時管理者的數量就可以減少。當管理者的數量減少之后,被管理者對管理者的監督就變得更加嚴格和仔細(因為小偷有決定什么時候出現的特權,所以一旦守衛選擇睡覺,小偷隨時都可能偷東西),也就減少了管理者的偷懶問題。十個人監視一個人肯定會比一個人監視一個人要輕松得多,長期下來就會形成一個良性循環。

在博弈當中,我們不僅要重視其他博弈方信息的獲取,還要重視己方信息的保密。這里說的保密并不是說不要讓對方看到自己的策略就可以,還要保證對方猜不到自己的策略,也就是達到前面所說的混合策略納什均衡。相比較純策略納什均衡而言,混合策略納什均衡更具有實踐意義。通俗地說,就是不采用單一的策略,而是多管齊下,用多種策略來應對對方。日常生活中大家其實就是這么做的,用一句古話說,這叫做“明修棧道,暗度陳倉”。在多種策略當中,有迷惑對方的,也有誤導對方的。在通信發達的現在,想要完全隱藏自己的動作是不可能的,那么我們能做的就是迷惑對方,讓對方無法判斷出我們的真正意圖。

把對手引到歧路上,就相當于隱藏了自己的蹤跡。

主站蜘蛛池模板: 华蓥市| 平谷区| 德安县| 石阡县| 比如县| 石渠县| 南召县| 家居| 新疆| 平罗县| 望谟县| 外汇| 彭阳县| 临泉县| 威信县| 克东县| 谷城县| 贺兰县| 葫芦岛市| 金沙县| 沙雅县| 内江市| 扎赉特旗| 壶关县| 乌兰县| 灵石县| 鄂伦春自治旗| 濉溪县| 饶平县| 湾仔区| 白水县| 邢台县| 韩城市| 宁南县| 车致| 星座| 吉水县| 嘉善县| 双峰县| 治县。| 宁乡县|