博弈中的策略和信息
我們在談博弈的時候一直在強調兩個詞,那就是策略和信息。博弈中的策略和信息與我們所熟知的含義略微有些不同,下面我們先來了解博弈中的策略。
策略是指我們在處理事情的時候所制訂的若干方案,當這一定義融入博弈論之后,就變成了博弈各方的決策內容,其決定因素是博弈方的能力水平和行動取舍。我們在定義一個博弈的時候,找出這個博弈的全部策略選擇是最重要的條件之一。
不同的博弈,策略會有所不同,即便是同一博弈的各個博弈方所能選擇的策略也不盡相同,甚至會出現某些博弈方只有有限的選擇,但是另一些博弈方卻有無限種選擇的可能,我們把這種情況叫做無限博弈。當一個博弈中的博弈方都只有有限種策略選擇的時候,這種情況叫做有限博弈。
一、有限博弈
有限博弈當中也會出現各種不同的情況,比如博弈各方策略選擇的數量和方向可能會有所差異,但也可能會完全相同。
比如說在買東西的時候,買方的策略選擇有三種:市場平均價、較高的價格、較低的價格。但是賣方的策略選擇就只有兩種:賣或者不賣。如果是競價購買的時候,買方因為需要考慮其他博弈方策略對自己的影響,所以思考的復雜性就會大大增加;但是對于賣方來說,依然還是只有賣或者不賣兩種策略。在這種模式之下,博弈各方的策略方向和數量都是完全不同的,所以我們在分析的時候也無疑增加了難度。
但是,也有一些策略選擇的數量和方向完全相同的博弈,比如“囚徒困境”就是一個很典型的例子。兩個犯人的策略選擇都只有兩種:招或者不招。他們的策略方向也是一致的,那就是減輕處罰。我們前面提過的“田忌賽馬”也屬于這種類型,此時博弈策略的分析就變得簡單了很多。
二、無限博弈
因為有限博弈的策略選擇是有限的,所以其結果也是有限的(即每一種策略選擇都可以找出相應的結果),因此我們在研究或者表達的時候就可以用最簡單的矩陣圖表顯示。與有限博弈不同的是,無限博弈因為某一個或多個博弈方擁有無數種選擇,所以其表達形式也就變得復雜了很多,只能用文字描述或者數學公式顯示。
我們可以通過一個簡單的例子來了解什么是無限博弈:
小明希望從他父親那里得到一筆錢,但是他的父親并不會輕易給他。
很顯然,小明需要一個理由說服自己的父親,也就是選擇一種策略。當小明在向父親闡述錢的用途的時候,可以是做生意,也可以是買房子,還可以是其他情況。只要能夠達到目的,無論什么樣的理由都可以,這就使他的策略選擇有了無數種可能。但是對于小明的父親來說,他的策略只有兩種:給或者不給。這是最簡單的一種無限博弈,如果是商場或者政治上的多方博弈,就會出現更加復雜的情況。
區別清楚“有限博弈”和“無限博弈”,對于我們理解和掌握博弈的分析方法是非常有意義的。
了解完博弈的策略,我們再來看博弈的信息。首先我們來了解博弈信息的結構。
信息在博弈當中是非常重要的一個因素,當處于博弈當中的時候,信息量的多少就代表我們對于自己和其他方面處境的了解程度。同時信息也對策略的選擇有著巨大的影響,有時候一條不起眼的信息很可能就起到扭轉生死的作用,只有掌握更多的信息,才能做出更好的選擇。我們可以通過一個例子來說明信息的重要性。
再次回到田忌賽馬的故事當中,有一個細節可能大家沒有注意到,那就是“及臨質”,意思是比賽即將開始。這說明了什么呢?說明孫臏的策略是在齊王不知情的條件下施行的(或者說即便知道了,也無法及時作出反應)。所以,田忌之所以會贏就是因為他們之間的信息不對稱,田忌知道齊王的策略順序,但是齊王卻不知道田忌的策略順序。試想一下,如果齊王早知道田忌的策略,那么肯定會拿出相應的對策來,勝負就變得撲朔迷離了。
由此可見信息在博弈當中的重要性。但是,這里我們需要強調一點:信息很重要,但并不是說缺少信息我們就無法決策,同時信息量越多并不代表得益越多,這點我們在前面也提到過。
博弈的信息在結構上可以分為得益的信息和博弈過程的信息。
一、得益的信息
所謂得益的信息,就是指博弈各方在不同策略下的得益情況,這里我們需要引申了解兩個概念:“完全信息”和“不完全信息”。
在“零和博弈”當中,結果一定是一方贏另一方輸,所以博弈各方都了解對方的得益情況,這種博弈就叫做“完全信息博弈”。例如在猜拳游戲當中,不論對方出石頭還是剪刀或者布,其得益情況都是一目了然的。
但是,有些時候博弈各方并不能完全了解對手的全部得益情況,這種博弈叫做“不完全信息博弈”。
例如,在一些同類產品廠商的博弈當中,如果各廠商對于其他廠商的生產能力、產品質量以及生產成本的情況沒有完全的了解,那么他們在策略選擇的時候就很難有針對性地采取措施,這就增加了決策的難度。假如a廠商的生產成本是1000元,b廠商的生產成本是1500元,那么a廠商完全可以憑借稍微高出b廠商成本的利益出讓贏得這次博弈,如果b廠商也付出和a廠商相同的代價,就很有可能出現虧損。但是在不完全信息博弈當中,a廠商并不知道b廠商的生產成本,所以為了贏得勝利,它很可能會最大限度地接近自己的成本范圍來決策,這時候即便贏得了博弈,但是最后的得益明顯會減少很多。
我們之所以重視得益的信息,就是因為其對決策有著巨大的影響,同時也會影響我們最終的得益。清楚地區別完全信息和不完全信息,對我們分析博弈的決策有著很大的幫助。
二、博弈過程的信息
想要了解博弈過程的信息,我們首先要了解一下什么是動態博弈。像猜拳游戲之類,雙方幾乎同時做出決策,而且事先都不可能了解對方策略的博弈,我們叫做“靜態博弈”;而類似于打牌之類,一方先做出決策,另一方再相應采取對策的博弈方式,叫做“動態博弈”。
動態博弈最大的特點就是有先后次序,所以后行動的博弈方可以很清楚地了解到之前其他博弈方的所有行動。例如打牌,最后一個出牌的人可以很清楚地知道前面幾個人出的都是什么牌,甚至可以計算出剩下哪些牌沒有出。這種情況我們稱之為“完美信息博弈”,因為各方的策略都一目了然,所以上一秒的優勢策略很可能在下一秒就變成了劣勢,也因此會給我們求解的過程帶來很大的麻煩。
很明顯,動態博弈對于先做出決策的一方是不利的,所以博弈各方都會想方設法地隱藏自己的行動。比如甲、乙兩家超市都在爭取同一個產品的代理權,產品的生產商為了節約時間,決定三家一起談判,一次性解決問題。這時候甲、乙兩方都需要拿出足夠有利的條件,贏得這次談判,但是為了不讓對手提前知道自己的底牌,兩家都會最大限度地隱藏自己的策略。這時候,不論是甲方還是乙方都不可能清楚地知道對方提出的條件,所以我們稱之為“不完美信息博弈”。
不完美信息之下的博弈使得博弈方在策略的選擇上面出現了一定的盲目性,因為它不知道其他博弈方做出了什么樣的決策,所以只能按照一定的期望概率去行動。我們在研究動態博弈的時候,必須分清楚信息的完美和不完美,才能準確地判斷各個博弈方的決策依據,同時結合完全信息和不完全信息,才能構成完整的博弈理論體系。
分析完博弈信息的結構之后,我們再談一下博弈信息的獲取。并不是說我們只要達到“知彼”就可以,我們在博弈的過程中不但要了解對方的情況,還要了解對方對自己了解多少,也就是“對方知道些什么,什么時候知道的”。在通信發達的現在,一部分經濟博弈可以看做是信息的博弈,如何最大限度地獲取信息,獲取信息之后又如何判斷信息的真偽,也是必不可少的一門技能,在后文中涉及的時候我們會具體闡述。
策略和信息是博弈論最重要的兩個組成部分,當我們掌握其中的細節時,才能建立起完整而系統的博弈方法論,才能知道如何分析和使用博弈論。