1.3 “囚徒困境”下的社會交換關系與最優策略選擇
1.3.1 重復博弈下的社會交換關系
社會交換關系建立的基礎是博弈雙方的相互信任,即自愿賦予對方損害自己利益的機會。在單次博弈情形下(a single game),“囚徒困境”中的參與者很難達成默契而都選擇“合作”策略。這是因為每一方都會擔心對方采取“背叛”行為,并且在單次博弈情形下“背叛”行為是不會受到對方懲罰的(對企業而言,采取背叛行為時的收益大于采取合作時的收益,如C>A且D>B),那么在雙方之間就不能可靠地形成“信任”。例如,游客往往因害怕買到假貨而不敢在旅游景點買紀念品。在這種情形下,要促成雙方的“合作”行為,就需要借助第三方(third party)的監督和懲罰手段,強制性地對雙方的行為進行規范和約束,才能達到促成合作的目的。但是,一旦第三方缺失,在單次的“囚徒博弈”中,博弈雙方就不能都選擇“合作”策略而實現社會福利的最大化。
當單次“囚徒困境”博弈轉變成重復博弈(repeated game),即雙方重復交易時,任何一方都可以在隨后的博弈中根據前一次對方所選擇的策略而做出反應。也就是說,一方可以對另外一方的“合作”行為予以回報而繼續選擇“合作”策略,也可以就另外一方的“背叛”行為進行懲罰而轉向選擇“背叛”策略。重復博弈中“懲罰”的出現有可能成為維持雙方之間信任關系和保持合作的有效機制。例如,企業間合作關系的形成,如建立戰略聯盟的前提是雙方有長期合作。
|CSR聚焦1-10|
戰略聯盟:企業間重復博弈的理性選擇
自從美國DEC公司總裁簡·霍普蘭德和管理學家羅杰·奈杰爾提出戰略聯盟的概念以來,戰略聯盟引起管理學界和企業界的廣泛關注。特別是20世紀90年代以后,戰略聯盟迅速發展成為一種普遍性制度安排。戰略聯盟一般是由具有共同利益關系的單位之間組成的合作共同體,他們可能是供應商、生產商、分銷商之間形成的合作聯盟,甚至是競爭者之間形成的合作聯盟。戰略聯盟是企業間相互博弈,形成集體理性,進行合作的結果。
趙庚科和郭立宏(2009)運用重復博弈理論,對區域產業集群內的企業怎樣通過多次重復博弈,理性選擇合作并形成企業間戰略聯盟的過程進行理論分析。研究發現,在市場交易中,當多個企業長期處于一個特定區域時,交易過程中企業間會經過多次反復的長期博弈,從而建立區域產業集群內企業的長期穩定合作激勵機制,進而促使集群內企業間合作。
資料來源:趙庚科,郭立宏,2009.基于重復博弈的區域產業集群內多企業間合作激勵機制研究[J].管理評論,21(08):122-128.
對應到圖1-5中的企業與利益相關者之間的博弈情形,就轉化為當企業在上一年選擇“合作”策略,即履行社會責任行為(如提高員工福利)而給某利益相關者(如員工)提供好處時,如果員工沒有給予企業正向回饋(如提升忠誠度)反而采取“背叛”策略(如曠工),那么企業就會在下一年放棄繼續履行社會責任轉而采取嚴格管理員工、強制加班、克扣工資等“背叛”行為,以作為對員工在上一年選擇“背叛”行為的懲罰。
如果由于懲罰機制的存在并且也是可信的(企業以很低的成本懲罰利益相關者的背叛行為),利益相關者預測到企業會對其“背叛”行為進行報復,那么對利益相關者而言,當面對企業的合作行為時,最佳的回應方式也是“合作”。這就能建立起互惠關系(reciprocity)。同時,隨著企業和員工合作關系的持續發展,雙方的信任不斷強化,從而有效保障企業和員工都能持續選擇“合作”策略。
需要強調的是,在重復“囚徒困境”博弈中,維持雙方“合作”的關鍵在于對“背叛”行為的懲罰要可信(credible),即一方相信對方會對自己的“背叛”行為進行實質性懲罰。這就涉及以下幾點:第一,一方知道對方采取了“背叛”行為而損害了自身的利益;第二,施加懲罰的成本不太高,即采取懲罰行為給自身帶來的損失不大;第三,一方施加的懲罰對另一方的利益產生顯著的負面影響。
上述三點保障了施加懲罰行為是可能的并且會因產生實質性影響而可信。如果一方缺乏對另外一方施加懲罰的能力,如施加懲罰的成本過高或不掌握懲罰對方的資源,那么這種懲罰機制就不可信,故而也就難以在雙方之間建立起長效的合作機制。例如,企業給投資者分紅希望投資者能長期持有股票,但是如果投資者拋售股票,企業也沒有有效的途徑去懲罰這些投資者。故而,在企業和投資者之間也很難基于分紅來形成長效的合作機制;投資者往往會根據企業的未來業績來選擇是否繼續持有股票。同樣的問題也存在于企業與消費者之間的合作中,企業低價銷售產品并不能保證消費者不去購買其他商品,因為企業如果懲罰某些消費者,限制其購買企業產品,對消費者而言并沒有多大損失。更可怕的是當消費者不能給企業施加可信的懲罰時(例如,消費者并不知道被企業欺騙),企業無良行為就會出現。
|CSR聚焦1-11|
三鹿毒奶粉事件:基于信任的互惠機制被打破
2008年9月,河北省石家莊市三鹿集團股份有限公司生產的三鹿牌嬰幼兒配方奶粉受到三聚氰胺污染,導致全國多名曾食用該奶粉的嬰幼兒出現泌尿系統結石。除三鹿外,眾多國產乳品企業均涉及三聚氰胺問題。
“三聚氰胺”事件引發了人們空前的恐慌。本是讓寶寶健康成長的奶粉,卻因為部分無良商家摻入了三聚氰胺而成為“毒奶粉”。據通報,截至2008年11月27日,全國共有294萬名嬰幼兒因食用問題奶粉患泌尿系統結石,重癥患兒154人,死亡11人。這些數字觸目驚心!2009年2月,三鹿集團正式宣告破產,相關負責人受到法律懲罰。然而,消費者對國產乳業的信任也被徹底打破,紛紛轉向購買進口奶粉。
不可否認,在三鹿毒奶粉事件發生后,國產奶粉質量的進步有目共睹。國家有關部門為確保乳品安全,也陸續出臺了《乳品質量安全監督管理條例》《原料乳與乳制品中三聚氰胺檢測方法》等規定。即便如此,多數消費者還是認為,國產奶粉質量不如進口奶粉;市場上,很多“奶爸奶媽們”仍選擇購買進口奶粉。“一朝被蛇咬,十年怕井繩”,基于信任的互惠機制一旦被打破便很難重建。
資料來源:任震宇.黑色記憶[N].中國消費者報,2009-03-13(17);顧仲陽.國產奶粉路還很長[N].人民日報,2013-05-13(17).
1.3.2 重復“囚徒困境”博弈下的最優策略選擇
1.固定合作對象之間的重復博弈
在重復“囚徒困境”博弈中,不排除一方會利用對方的信任而選擇“背叛”行為。但是,根據重復“囚徒困境”博弈中的最優策略選擇的研究來看,這種用“背叛”回應對方“合作”的行為并不是最優策略。最常見也是最有效的策略就是此前所描述的“以牙還牙”(tit for tat)策略。無論是企業還是利益相關者,實際上都會遵循這一策略原則來發展與對方的交換關系。這一策略的好處是無須第三方的存在就能維持合作關系,并且也很容易在交易過程中得以運用。實際上,如果放棄采取這一策略,如背叛與自己合作的人,或者與背叛自己的人合作等,長期來看都會使自己的利益受損。“以牙還牙”策略本質上也是在面對錯綜復雜的外部環境時,確保對方保持合作的最優手段。
在現實生活中,我們也經常能看到類似的例子,廣泛存在于企業與利益相關者之間的交換關系中。例如,企業董事會給經理制定高工資,經理便更加努力工作;公司關心員工的身心健康,改善工作環境,能提升員工的工作滿意度、忠誠度、工作效率等;公司支持政府改善民生,也會得到政府的政策優待,從而得到更多的發展機會。許多研究表明企業履行社會責任能提高企業績效,其中的原因就是企業履行社會責任能得到利益相關者的正面回饋,從而有利于企業獲得更多的資源而提高經濟效益。這些實際上都是典型的互惠行為,并且都是在“以牙還牙”策略機制的保障下才能得以實現的。
|CSR聚焦1-12|
企業社會責任對利益相關者影響的研究
從20世紀70年代開始,關于企業社會責任后果的研究(consequences)不斷增加,很長一段時期研究主要關注企業社會責任對企業財務績效的影響,也就是說,企業是否受益于企業社會責任活動。
20世紀90年代后,越來越多的學者開始關注企業社會責任對企業非財務績效(non-financial performance)的影響,認為企業履行社會責任可以獲得利益相關者的認可,提升企業聲譽和形象并增強與利益相關者之間的關系。企業履行社會責任還具有保險作用(Godfrey, 2005),即當這些企業發生負面事件時,企業受到的“懲罰”會更少。另外,高聲譽的企業可以提高對求職者的吸引力(Jones et al., 2014)、客戶滿意度(Conlon and Murray, 1996)、首席執行官繼任率(Gomulya and Boeker, 2014)等。
資料來源:WANG H, TONG L., TAKEUCHI R, et al., 2016. Corporate social responsibility:An overview and new research directions[J].Academy of Management Journal, 59(2):534-544.
當然,隨著對重復“囚徒困境”下的最優選擇策略的深入研究,人們發現了一些比“以牙還牙”更為優秀的策略。例如,“寬容以牙還牙”策略就能給交易雙方帶來更高的收益,其核心思想是在面對“背叛”行為時,并不是像“以牙還牙”策略那樣確定性地進行懲罰而采取“背叛”行為,而是也可能繼續采取“合作”的策略來原諒對方一次(注意,當面對“背叛”時隨機選擇是否“合作”)。因為有時候,對方采取“背叛”行為并非有意的,也可能是無意而為之,如果沿用“以牙還牙”策略,就喪失了與其重歸合作的可能,這無疑會損害雙方利益和社會整體福利。如果采取“寬容”的態度,試圖原諒“背叛”,那么就有可能挽救瀕臨破裂的合作關系。
|CSR聚焦1-13|
博弈競賽與“以牙還牙”策略
1980年,密歇根大學阿克塞爾羅德(Axelrod)教授發起了一場比賽,邀請許多博弈論學者玩一場200輪的“多重囚徒困境”的游戲,要求參賽者每人設計一個程序,通過程序模擬合作策略進行多輪循環賽,每個程序會根據上一輪的合作結果,得到一個分數,總分最高的就是冠軍。
賽前預測結果時,大多數人認為根據不同的合作情況,設計出最復雜、最全面策略的人更可能贏得比賽。然而最后的冠軍是一個最簡單的程序,這個程序由計算機科學家拉波彼特(Lapopite)編寫,名叫“Tit for Tat”,即“以牙還牙”。“以牙還牙”策略具體為:第一步合作,之后每一步重復對手的行動,即你合作我合作,你背叛我背叛。比賽結果引發了社會各界的興趣,因此舉辦了規模更大的第二場比賽,最后勝利的依然是最簡單的“以牙還牙”策略。
然而,在現實合作中一方可能因為疏忽大意而選擇背叛,即“并非故意欺騙”。對于這類錯誤,如果雙方都采取“以牙還牙”策略,就會引發永無止境的報復行為,造成兩敗俱傷。后來哈佛大學諾瓦克(Nowak)教授設計了一系列的合作策略,如永遠不欺騙的策略、永遠欺騙的策略、以一定的小概率(隨機)懲罰對方的“寬容以牙還牙”策略等。結果顯示,“以牙還牙”策略輸給了更加友善的“寬容以牙還牙”策略,即當對方犯錯時,適當地采取“寬容”態度,原諒對方并爭取下一次的合作。
資料來源:湛廬文化.哪種合作策略能讓你在競爭中勝出?[EB/OL].(2020-05-20)[2022-12-05]. https://baijiahao.baidu.com/s?id=1667138112237666680&wfr=spider&for=pc.html.
雖然理論是美好的,但是對合作方而言,其是否會采取這種“寬容以牙還牙”策略,則受到許多因素的影響,如個人的合作傾向、對對方的信任程度等。這就使得在現實環境中一方如何回應另一方“背叛”行為的決策變得復雜。
|CSR聚焦1-14|
蜜雪冰城安全事件:寬容以牙還牙?
2021年5月,知名加盟連鎖茶飲品牌“蜜雪冰城”被媒體曝光個別門店存在篡改開封食材日期標簽、違規使用隔夜冰激凌奶漿、檸檬表皮不清洗等衛生問題和食品安全隱患。5月15日,鄭州市市場監管局全面檢查蜜雪冰城鄭州所有門店,發現部分門店確實存在違法違規問題,責令35家門店限期整改、3家門店立即停業整改,并對9家門店下達行政處罰決定書。
事件發生后,蜜雪冰城第一時間向監管部門、媒體和社會公眾真誠地道歉,并表示將積極配合各級政府的監督檢查,組織專項處理小組對門店存在的嚴重違規行為進行調查整改,對涉事門店做出停業整頓處理。此外,蜜雪冰城還將緊急召回部分經營團隊,對其進行二次深化培訓,進一步從嚴管理門店,為消費者提供放心健康的產品。
在事件發生后,有媒體聯系到鄭州的部分蜜雪冰城門店,大多表示客流并未受到太大影響,只是檢查和管控更仔細和嚴格了。同時,大部分受訪的顧客表示雖然看到相關事件的報道,但是沒太關注。線上網友的評論進一步印證了消費者對于蜜雪冰城的寬容態度。
資料來源:耿記安. 35家門店被責令限期整改[N].中國消費者報,2021-05-20(1);新浪財經.食安風暴半個月后,蜜雪冰城怎么樣了?[EB/OL].(2021-05-31)[2022-12-05]. https://baijiahao.baidu.com/s?id=1701272781238476193&wfr=spider&for=pc.html.
2.陌生合作對象之間的重復博弈
以上所介紹的交換關系都是發生在兩個固定的交易對象之間的,也就是雙方是熟悉的。我們很容易理解,在熟悉的雙方之間信任關系是容易建立起來的,從而能保證合作的持續進行。此外,在現實生活中,即便是在陌生人之間,也能建立起信任和互惠關系。在這個過程中,參與方的聲譽,即此前與利益相關者合作時是否有背叛行為,就顯得非常重要。
|CSR聚焦1-15|
救助巧克力工廠
新西蘭但尼丁的鮑德溫街全長僅350米,但傾斜角度達到驚人的35°,被載入吉尼斯世界紀錄,吸引了許多游客前來旅游打卡,同時也是當地孩子們的游樂園。另外,孩子們非常喜歡鎮上的吉百利(Cadbury)巧克力工廠,經常光顧。在家鄉人民的支持下,再加上背靠著名景區,吉百利工廠迅速發展成為遠近聞名的公司。
工廠廠長牢記公司的發展離不開當地人的支持,因此希望能回饋當地,尤其是回饋鎮上的孩子。因此,自2002年開始,“巧克力豆奔跑大賽”應運而生。該比賽將巧克力豆球分為三組,從鮑德溫大街傾灑而下,最先沖過終點的15個巧克力豆的主人會得到一份豐厚的大禮。同時,吉百利工廠會把該活動售賣收入捐給慈善機構,用于幫助無家可歸的孩子、老人,以及絕癥兒童。這一活動受到了廣泛的歡迎。吉百利工廠連續15年舉辦慈善活動,截至2016年,該公司一共籌到了善款90萬元紐幣(大約443萬元人民幣)。
然而,2017年7月,吉百利工廠突然因資金斷裂而宣布倒閉,追問之下廠長道出實情:由于物價飛漲,金融危機,工廠卻始終堅持巧克力豆不漲價,因而連年虧損,使得工廠不得不宣布破產。雖然工廠員工曾提議取消舉辦該比賽或提高巧克力豆的價格,但是工廠負責人為了能幫助孩子及老人,即使面臨破產的局面也仍舊堅持舉辦該比賽。當小鎮居民得知該工廠將破產之后,都認為這樣一家有良知和善心的公司不應該倒閉,因而自發組織了眾籌,甚至國外網友也參與進來。短短兩天時間,就眾籌了300萬元紐幣(大約1 386萬元人民幣),最終幫助公司渡過了難關,“巧克力豆奔跑大賽”也持續進行。
資料來源:搜狐網.這家公司倒閉了,竟有450萬人搶著捐款,硬生生給救活了[EB/OL].(2022-05-20)[2022-10-16]. https://www.sohu.com/a/549149881_121124291.
對一家具備良好聲譽的企業而言,哪怕某一利益相關者此前沒有與之發生交換關系,也會通過了解其聲譽而決定如何與之開始合作。另外,一方也可能并沒有掌握另一方的聲譽信息,即出現信息不對稱,從而影響合作的開展。例如,銀行在發放貸款的時候都傾向于與大企業合作,而對于中小企業的貸款申請則非常謹慎。這也是中小企業貸款難的一個重要原因,即銀行沒有這些企業聲譽的信息。
總結來看,在對重復“囚徒困境”博弈最優策略的研究中,信任是合作關系產生的基石,寬容是維護合作關系的緩沖劑,而聲譽則是擴大合作網絡的催化劑。這一點對于我們理解企業為何履行社會責任,履行社會責任有何效果,以及如何履行社會責任至關重要。簡言之,企業履行社會責任的目的就是建立和利益相關者之間的信任關系,樹立企業聲譽;履行社會責任的效果就是與眾多利益相關者建立起這樣的信任關系;而如何履行社會責任則取決于合作方式能否有效地達成企業建立信任和樹立聲譽的目的。