- 從擲骰子到阿爾法狗:趣談概率
- 張天蓉
- 5979字
- 2019-10-16 10:18:41
5.賭徒謬誤:賭博與大數定律
先講一個賭場撈金的故事。
很多人都聽說過概率或統計中的蒙特·卡羅(Monte Carlo)方法,說白了就是利用大量數據在統計的基礎上進行計算的方法。蒙特·卡羅不是人名,是法國邊上一個袖珍小國摩納哥的著名賭場的名字。自從蒙特·卡羅賭場于1865年開張后,摩納哥從一個窮鄉僻壤的小國,一躍成為歐洲最富有的國家之一。至今已經150年過去了,這個國家仍然以賭場和相關的旅游業為主。
當時有一個名叫約瑟夫·賈格爾(Joseph Jaggers)的英國人,是約克郡一個棉花工廠的工程師。他在擺弄加工棉花的機器之余,經常光顧蒙特·卡羅賭場,他對那種38個數字的輪盤游戲特別感興趣(圖1-1-6)。賈格爾是位優秀的機械工程師,腦袋中的想法比一般賭徒要多一點。他想:這個輪盤機器在理想的情況下,每個數字出現的概率都是1/38。但是,機器怎么可能做到完美對稱呢?任何缺陷都可以改變獲獎號碼的隨機性,導致轉盤停止的位置偏向某些數字,使這些數字更為頻繁地出現。因此,賭徒應該可以利用這種偏向性來賺錢!于是,在1873年,賈格爾下決心要改變自己的命運。他帶上所有的積蓄,前往蒙特·卡羅賭場。他雇用了6個助手,每個助手把守一個輪盤機器。白天,賭場開放了,助手們用賈格爾供給他們的“賭幣”,讓輪盤不停地嘩啦嘩啦轉!不過,他們并不在乎輸贏,他們的任務是記下所把守的輪盤機停止時的每一個數字。到了晚上,賭場關門后,賈格爾便在旅館里獨自分析這些數字的規律。6天后, 5個輪盤的數據沒有發現有意義的偏離,但第6個輪盤為賈格爾帶來了驚喜:38個數字中有9個數出現的概率顯然要比其余的頻繁得多!賈格爾興奮不已,第7天他前往賭場,認定了那臺有偏向性的輪盤機,大量投注這九個頻率高的數字:7、8、9、17、18、19、22、28和29。這種方法使賈格爾當天就賺了7萬。不過,賈格爾沒高興幾天,事情便引起了管理人員的注意,經理們采取了各種方法來挫敗賈格爾的策略。最后賈格爾無法賺更多的錢,便離開了賭場,帶著已經到手的巨款,投資房地產去了。
賭場中確有極少數人像賈格爾那樣偶然幸運地賺了一筆,但更多的賭徒是十賭九輸,一直到輸光為止。這其中的原因有兩個:一方面是因為所有賭場游戲的概率設計本來就是以利于賭場為準,讓賭場一方贏的概率為51%或52%,玩家贏的概率為49%或48%,如此設計的賭場才能包賺不賠。另一方面,利用賭徒的心態也是賭博游戲設計者們的拿手好戲。賭徒謬誤便是一種常見的、不符合概率規則的賭徒錯誤心態,經常被賭場利用。
· 賭徒謬誤
賭徒謬誤的來源是因為將前后互相獨立的隨機事件當成有關聯而產生的。怎么樣算是獨立的隨機事件呢?比如說,拋硬幣一次,是一個隨機事件;再拋一次,是另一個隨機事件。兩個事件獨立的意思是說,第二次的結果并不依賴于第一次的結果,互相沒有關聯。假設硬幣是理想對稱的,將出現“正”記為1,“反”記為0,那么每次結果為1和0的概率都是1/2。第二次“拋”和第一次“拋”互相獨立,再多“拋”幾次也一樣,每次的“拋擲”事件互相獨立,出現1和0的概率總是“1/2、1/2”,都和第一次一樣。即使硬幣不對稱,比如正反面之概率可能是“2/3、1/3”,也并不會影響每次拋擲的“獨立性”,每次得到正面的概率都是2/3,并不受上一次結果的影響。
道理容易懂,但有時仍會犯糊涂。比如說,當你用“公平”硬幣接連拋了5次1,到了第6次,你可能會認為這次1出現的概率更小了(<1/2),0出現的概率更大了(>1/2)。也有人是逆向思維,認為既然5次都是1,也可能繼續是1(也被稱為熱手謬誤)。實際上這兩種想法,都是掉進了“賭徒謬誤”的泥坑。也就是說,將獨立事件想成了互相關聯事件。事實上,一般來說,每次擲硬幣的結果,并不影響下一次正反的概率。硬幣沒有記憶,不會因為前面5次被拋下時都是正面在上,就會加大(或減小)反面朝上的概率。也就是說,無論過去拋出的結果如何,每一次都是第一次,正反出現的概率都是1/2。
還有一個笑話:某呆子上飛機時身上帶了個炸彈。問其原因,答曰:飛機上有1個炸彈的概率是萬分之一,同時有兩人帶炸彈的概率就是億分之一,我自己帶上一個,便將飛機上有炸彈的概率從萬分之一降低到了億分之一!想必你看到這兒,一定會抿嘴一笑。是啊,能不笑嗎?此呆子將“自己帶炸彈”與“別人帶炸彈”的獨立事件視為相關,呆子非賭徒,但這也算是一種賭徒謬誤。
當然,認為每次拋硬幣是互不關聯的獨立事件,也只是我們描述某些隨機事件所使用的數學模型而已,物理世界中的此類事件并不一定真正獨立。比如說到生男生女的問題,也許有某種與激素有關的原因使得前后兩胎的性別有所關聯,也不是沒有這種可能性。但是,如果有關聯,也要明白是如何關聯的;應該使用何種模型來描述這種關聯;那是另一種類型的研究課題,而賭徒謬誤指的則是將基本上沒有關聯的隨機事件認為有關聯來考慮問題而產生的謬誤。
賭徒有了“賭徒謬誤”的心態,會輸得更慘(圖1-5-1)。比如說,賭場中著名的輸后加倍下注系統(Martingale)便是利用賭徒謬誤的例子。賭徒第一次下注1元,如輸了則下注2元,再輸則下注4元,如此類推,直到贏出為止。賭徒以為在連續輸了多次之后,勝出的概率會非常大,所以愿意加倍又加倍地下注,殊不知其實概率是不變的,賭場的游戲機和通常拋擲的硬幣一樣,沒有記憶,不會因為你輸了就給你更多勝出的機會。賭徒或是因為不懂概率,或是因為人性的弱點,往往自覺或不自覺地陷入賭場設置的陷阱中。

圖1-5-1 賭徒謬誤
賭徒謬誤不僅見于賭徒,也經常反映在一般人的思維方式中。人們在預測未來時,往往傾向于把過去的歷史作為判斷的依據,也就是說,根據某事件曾經發生的頻率來預言事件將要發生的可能性。中國人說“風水輪流轉”,這句話在很多時候反映了現實,但如果將這種習慣性的思維方法隨意地應用到前后互相獨立的隨機事件上,便成為賭徒謬誤。
即使明白地認識到“賭徒謬誤”的錯誤,許多人仍然會犯糊涂。就數學原因而言,有幾個容易混淆的概念,下面我們仍然用拋硬幣實驗來說明。
有人說:如果連續4次都是出現正面,接下來的第5次還是正面的話,就接連5次都是正面,根據概率論,連拋5次正面的概率是1/25=1/32。所以,第5次正面的機會只有1/32,而不是1/2。
以上論證是混淆了“在硬幣第1次拋出之前,預測接連拋5次均為正的概率”和“拋了4次正面之后,第5次為正面的概率”,前者等于1/32,后者卻是1/2。
前者指的是:在硬幣第1次拋出之前,如果預測接連拋5次的各種可能性,共有25=32種不同的排列情形,等效于從00000到11111的32個二進制數。每一種情形出現的概率均為1/32。后者指的是:已經拋了4次均為正面,那么,4次的結果已經固定了(1111),沒有再選擇的機會。剩下的第5次,可能是1或0,即總結果只有兩種:11111或11110,各占1/2。
· 誤用大數定律
賭徒謬誤產生的另一個原因是對“大數定律”的誤解。
首先要說說大數定律是什么【8】。如果要用一句通俗的話來概括的話,大數定律就是說:當隨機事件發生的次數足夠多時,發生的頻率趨近于預期的概率。
對一枚對稱的硬幣而言,正面的預期概率是1/2。當我們進行n次實驗后,得到正面出現的次數n正,比值p正=n正/n,叫作正面出現的頻率,頻率不一定等于概率(1/2)。但是,當n逐漸增大時,頻率將會逐漸趨近1/2。擲骰子的情形也類似,擲100次,數目為1的面也許出現了20次,即出現1的頻率是1/5;如果擲了10000次之后, 1出現了1900次,那么這時出現1的頻率是1900/10000=19%。如果這個骰子是六面對稱的,出現1的頻率會隨著投擲次數的增加而趨近于1/6,即預期的概率。也就是說,頻率取決于多次實驗后的結果,而概率是一個極限值。實驗次數增大,頻率趨近概率,這就是大數定律。
賭場賺錢的秘訣也是在于大數定律。賭博機一般被設計為“51%∶49%”的預期概率,賭場贏的概率至少51%。因此,賭場永遠不會和你進行“一錘子買賣”的交易,他們只需要多多地、不停地招攬顧客,然后,隨著賭博機咕嚕咕嚕轉動,硬幣叮當叮當落下,賭徒們以為自己要賺大錢了,老板們卻心中暗喜,靜等大數定律顯示威力,他們則坐收漁利。
提出并證明了大數定律最早形式的人是瑞士數學家雅各布·伯努利(Jakob Bernoulli,1654—1705),他是概率論的重要奠基人。大數定律發表于他死后8年,即1713年才出版的《猜度術》中,這本巨著使概率論真正成為數學的一個分支,其中的大數定律和稍后的 A.棣莫弗(A.de Moivre)和P.S.拉普拉斯(P.S.Laplace)導出的“中心極限定理”,是概率論中極其重要的兩個極限定理。
有一個墨菲定律:凡事有可能會出錯,就一定會出錯!就是說,如果暫時沒出錯,也只是時間問題。大數定律體現了類似的意思:當試驗次數足夠多時,事件發生的頻率終究會趨向于它的概率。次數n趨向于無窮,概率小的事件也會發生。換言之,一件事情,只要有發生的概率,那么隨著重復次數變多,就幾乎一定會發生。
上面的說法也基本上是略知大數定律的賭徒們的說法,這種說法理論上沒錯。錯在對“多次重復”的理解。多少次試驗才算“足夠多”,才到達大數定律能夠適用的大樣本區間呢?此問題的答案:理論上是無窮大,實際中難以定論。大多數情形是:還沒到“足夠多”,該賭徒便已經財力耗盡、賭注輸光、兩手空空了!
有人喜歡買彩票,并且在每次填寫彩票時,要選擇以往中獎號碼中出現少的數字,還振振有詞地說這樣做的依據是大數定律,某個數字過去出現得少,以后就會多呀,為什么呢?“要滿足大數定律?。 笨梢妼Υ髷刀烧`解之深。

圖1-5-2 雅各布·伯努利和大數定律(彩圖附后)
某些賭徒思維的誤區,便是將大數定律應用于試驗的小樣本區間,將小樣本中某事件的概率分布看成是總體分布,以為少數樣本與大樣本區間具有同樣的期望值,把短期頻率當成長期概率,或把無限的情況當成有限的情況來分析。實際上,這是在錯誤應用大數定律時的心理偏差,因此被心理學家卡尼曼和特維爾斯基戲稱為“小數法則”。事實上,任何一段有限次的試驗得到的頻率對于足夠多次試驗的頻率幾乎沒有什么影響,大數定律說的是總頻率趨近于概率值,如圖1-5-2(b)所示,小樣本區間試驗的結果并不影響最后趨近的概率。
發現大數定律的雅各布·伯努利所屬的伯努利家族【9】,當年在歐洲赫赫有名,是世界頗負盛名的科學世家,出了好幾個有名的科學家,影響學界上百年。雅各布和他的弟弟約翰·伯努利(Johann Bernoulli,1667—1748),都是那個時代著名的數學家。此外,學物理的人都知道流體力學中有一個著名的伯努利定律,說的是有關不可壓縮流體沿著流線的移動行為,是由雅各布的侄子丹尼爾·伯努利(Daniel Bernoulli,1700—1782)提出的。
有意思的是,伯努利家族的這幾個科學家相處得并不和諧?;ハ嘣诳茖W成就上爭名奪利、糾紛不斷。尤為后人留下笑柄的是約翰·伯努利,他與比他大十幾歲的哥哥雅各布之間進行過激烈的兄弟之爭。事實上,雅各布還是約翰走進數學大門的啟蒙老師。約翰進入巴塞爾大學時,雅各布已經是數學教授,但兩人互相嫉妒、明爭暗斗。不過,無論如何,伯努利兄弟的你爭我斗實際上也推動了變分法、泛函分析、概率論等數學領域的發展。之后沒過幾年,哥哥雅各布就去世了。弟弟約翰卻似乎過不了沒有競爭對手的日子,他繼而又把對雅各布的嫉妒心轉移到了自己的天才兒子丹尼爾·伯努利的身上。據說他為了與兒子爭奪一個獎項把丹尼爾趕出了家門,后來還把丹尼爾的成果據為己有。
· 圣彼得堡悖論
伯努利家族中的另一位,丹尼爾的堂兄尼古拉 I.伯努利(Nikolaus I.Bernoulli,1687—1759),也是一名熱衷研究賭博的數學家,他提出了著名的“圣彼得堡問題”。為了理解這個悖論,首先從賭博游戲的期望值說起。
賭博的輸贏與期望值有關,期望值是以概率為權重的、隨機變量的平均值。賭博的方式不一樣,“贏”的期望值也不一樣。在第1章第一個故事中,曾經以38個數字的輪盤為例,計算過顧客贏錢的期望值。這里復習一下期望值的計算方法:仍然按照一般賭場的規矩,顧客將賭注押在其中一個數字上,如果押中,顧客得到35美元,否則損失1美元的賭注。顧客贏錢為正,損失為負,則顧客“贏錢”的期望值公式為:
E(顧客“贏”的期望值)=-輸錢數×輸錢概率+贏錢數×贏錢概率
第一項加上了一個負號,因為它表示的是顧客“輸”掉的錢數。由此計算出上述假設條件下“顧客贏”的期望值(元):

顧客贏的總期望值是負數,對賭徒不利。但設想有個傻一點的賭場老板,將上面規則中的35元改成38元的話,算出的期望值就會成為正數,這種策略就對顧客有利了。如果將35元改成37元呢?這時候算出來的期望值為0,意味著長遠來說,賭徒和賭場打平了,雙方不輸不贏(不計開賭場的費用),稱之為“公平交易”。
因此,期望值往往被作為所謂的“理性賭徒”們決定“賭或不賭”的數學依據。
然而,根據這個數學依據做出的決策,有時候完全不符合人們從經驗和直覺所作的判斷。這是怎么回事呢?尼古拉·伯努利便是以“圣彼得堡悖論”為例對此提出了質疑。
尼古拉設想了一種簡單的游戲方案:顧客不需要每次下賭金,但得買一張價錢固定(m元)的門票參加,游戲規則如下:
顧客只是不停地擲一枚公平硬幣,擲出正面就停止,擲出反面就繼續擲,直到擲出正面為止,見圖1-5-3(a)。如果游戲停止了,顧客就能得到獎金,獎金的數目與擲的次數有關。游戲持續得越久,獎金就越高。比如說,游戲停止時顧客擲了n次,那么顧客可得獎金數為2n元。

圖1-5-3 圣彼得堡問題
(a)游戲過程在得到正面時停止;(b)獎金數指數增加,概率指數減小
敘述得更具體一點:如果第一次擲出正面,游戲停止,顧客只能得2元(21元);若擲出反面,就繼續擲。若第二次擲出正面,顧客得4元(22元),若擲出反面,又繼續擲……依次類推,顧客若一直得到反面直到第n次才擲出正面,獎金數便是2n元,獎金數隨n增大而指數增加。
現在,計算這個游戲中顧客“贏錢”的期望值,即每次期望贏得的錢,乘以概率后相加。然后,再將m元的門票作為負數放進去,得到期望值是:

從以上計算可見,無論門票m是多少(有限數),得到的期望值都是無窮大!上面的結論顯得有些詭異,因為“期望值無窮大”意味著無論收多高的門票費,賭徒都會樂意參加這個游戲!但是這與事實太不符合了。如果你作一個民意調查便會發現,大部分人可能不愿意花多于60元去玩這個游戲,因為風險太大,要能夠拋到6次以上,才能贏回門票錢,但人們憑經驗知道,接連拋6次硬幣的結果是(TTTTTH)的情況是非常少見的。
這就出現了矛盾。因此,尼古拉認為這是一個悖論。人們在做決策的時候,并不僅僅考慮數學期望的大小,更多的是在考慮風險。數學期望值不能完全描述風險。
為什么叫“圣彼得堡悖論”呢?因為這個悖論被尼古拉提出,卻是被丹尼爾解決的,丹尼爾提出經濟學中的效用理論來解釋這個問題,論文發表在1738年圣彼得堡召開的一次學術會議上,所以得名為圣彼得堡悖論【10】。
另一個與賭博有關的著名問題是“賭徒輸光問題”,留待以后介紹。賭博雖然是一種惡習,但由它卻引發了不少有趣的數學問題,促進了概率論的發展。圣彼得堡悖論的解決建立了“效用理論”,推動了經濟學的發展。概率論中除了大數定律之外,還有一個極其重要的“中心極限定理”,有關中心極限定理及其應用,是我們下一節的內容。