官术网_书友最值得收藏!

  • 玩轉世界的十大公式
  • (瑞典)戴維·森普特
  • 14562字
  • 2023-05-08 17:50:18

第1章 博彩公式

我第一次在酒店大堂見到揚和馬里烏斯時就驚到了,他們比我在大學里教的學生大不了多少。他們希望從我這兒學到更多的數學知識,而我也希望從他們身上盡可能多地了解博彩的世界。

我們之前在網上聊過,但這是第一次在現實中碰面。他們在此次歐洲之行中已經見過了眾多足彩專家和專業咨詢人士,旨在為接下來的一年做準備。我所在的瑞典烏普薩拉是他們的最后一站。

在我們準備離開酒店的時候,馬里烏斯問道:“我們需要把筆記本電腦帶去酒吧嗎?”

“當然!”我回應道。

這次見面只是為了讓彼此熟悉一下,正式的工作第二天才開始,但我們三個都知道,即使是不太正式的交談,也會用到一些數字計算,因此需要帶上電腦隨時待命。

你可能會認為你需要了解很多知識才能更準確地下注,你需要對比賽有深入的了解,包括了解雙方球員的特點和傷病情況,也許你還需要得到一些內部消息。10年前,這一觀點可能還是對的。在那時,仔細看比賽、觀察每個球員的肢體語言以及觀察他們在對抗時的表現如何,能讓你比只會支持本地球隊的下注者更有優勢。但今時不同往日。

揚對足球的興趣并不大,對即將來臨的2018年世界杯[1]的大部分比賽也都不感興趣。“我會看一看德國隊的比賽。”他帶著自信的微笑說道。

這個夜晚正逢世界杯開幕式,一場盛大賽事的開始。無論你喜歡與否,只要生活在這個星球上,你都會不可避免地聽到與世界杯相關的消息。但是對于揚來說,除了自己國家的隊伍,其他球隊對他來說都一樣——不論是德甲、挪超聯賽還是世界杯,也不論是網球還是賽馬。任何運動的任何一場比賽對他和馬里烏斯而言都只是一個賺錢的機會而已,而正是對賺錢機會的渴求讓我認識了他們。

幾個月前,我發表了一篇關于足球博彩模型的論文。1這不是一個普通的數學模型。在2015—2016賽季的英超聯賽開始之初,我寫下了一個公式,利用該公式投注英超聯賽,你就可以打敗莊家!

截至2018年5月,它已經獲得1 900%的利潤。如果你在2015年8月按照我的模型投注100美元,那么在不到3年后的今天,你將獲得2 000美元。而你唯一要做的就是嚴格地根據我的模型下注。

我的公式與球場上發生的一切無關。它并不涉及比賽的過程,也與誰贏得了世界杯無關。我的方法涉及一類與莊家賠率有關的數學函數,我們根據歷史偏差對其做出調整,并給出新的下注賠率。這就是贏錢所需的全部了。

我公布了自己的公式,這引起了相當多的關注。我曾在《經濟學人1843》這本生活雜志上發表過相關細節,并在接受英國廣播公司、美國消費者新聞與商業頻道、報紙和社交媒體采訪時都談到了這些細節。這些都不再是秘密,但揚和馬里烏斯想請教我的就是這個模型。

“你為什么會覺得你到現在還有優勢呢?”馬里烏斯問道。

賭博中最重要的是信息,如果你擁有一些別人不知道的信息,并且那些信息能掙錢,那么你最不應該做的就是跟人分享這些信息。“優勢”一詞就是指你比莊家多了解的一點點信息。為了不喪失掉優勢,你應該保守秘密。如果這些信息泄露了,那么所有人都能利用它,而莊家也會修改賠率,你的優勢也會喪失殆盡。話雖這么說,我卻做了相反的事,我抓住一切機會告訴人們我的公式是什么。馬里烏斯想知道,為什么盡管這樣大肆宣傳,我的模型仍然奏效。

你只要看看我每天收到的詢問投注技巧的電子郵件和私信,就能回答馬里烏斯所提的問題了。“你認為誰會贏得明天的比賽?我讀過很多有關你的文章,我漸漸開始相信你了。”“我打算籌集創業啟動資金,你關于博彩的建議肯定會帶領我朝正確的方向前進。”“你買了誰,克羅地亞還是丹麥?我的直覺告訴我丹麥會輸,但我不太確定。”“你覺得英格蘭這場比賽的結果會是什么?平局嗎?”類似的提問數不勝數。

我對此毫無得意之情,但人們不斷向我發送這些消息也回答了馬里烏斯的問題:我的模型依然可以讓人們獲利。盡管我反復強調了我的方法的局限性,并強調它是基于統計的長期戰略,但公眾的詢問仍集中在“阿森納在本周末能否獲勝?”“如果薩拉赫不參加比賽,埃及能否從小組賽中突圍?”這類問題上。

給我發送電子郵件的人至少在互聯網上搜索過數學和賭博建議,但有更多的人不做任何研究就去參與賭博。有人賭博是出于第六感,有人是為了娛樂,也有人是因為喝醉了,或者因為他們需要現金,在某些極端情況下,有人賭博是因為他們上癮。總的來說,與使用我的方法或類似方法的一小群職業賭徒相比,這類人明顯更多。

我向馬里烏斯解釋說:“該模型仍奏效的原因是,它給你提供的投注建議通常是人們不愿意去照做的。在利物浦對陣切爾西時押平局或在小賠率下押曼城能踢贏哈德斯菲爾德并不是一件有趣的事。”賺錢需要時間和耐心。

馬里烏斯發給我的第一封電子郵件不屬于通常那99%的類型。他告訴我他和揚合作開發了一個自動系統,試圖在博彩市場中贏利。他們的想法是大多數博彩公司屬于“軟”博彩公司,即它們提供的賠率并不總是能反映出球隊獲勝的真實可能性。

絕大多數下注者(很可能包括所有向我發送信息詢問投注技巧的人)都會通過“軟”博彩公司下注。像帕蒂鮑爾、立博和威廉希爾這樣街知巷聞的公司都屬于這一類,相對沒那么出名的線上博彩公司紅博和888體育也屬于這一類。這些莊家優先提供特殊優惠,鼓勵顧客進行下注,但很少試圖獲得反映體育賽事真實結果的賠率。“硬”博彩公司(如平博或火柴盒)需要準確調整賠率以預測比賽結果,余下的1%的賭徒往往選擇這種博彩公司。

馬里烏斯和揚的想法是利用“硬”博彩公司從“軟”博彩公司那里賺錢。他們的系統會監視所有博彩公司的賠率,包括“硬”的和“軟”的,并從中尋找差異。如果其中一個“軟”莊家提供的賠率比“硬”莊家更大,那么他們的系統將建議在這位“軟”莊家處下注。這種策略并不能保證一定會取得勝利,但是由于“硬”博彩公司給出的賠率更加準確,這帶給了馬里烏斯和揚最重要的優勢。從長期看,在下注成百上千次之后,他們將從“軟”博彩公司那里贏錢。

馬里烏斯和揚的系統有一個局限性:“軟”莊家會禁止獲勝者入場。這類博彩公司由莊家決定是否允許你投注,一旦看到馬里烏斯和揚的賬戶開始贏利,莊家便會禁掉他們的賬號。博彩公司會發送類似這樣的信息:“現在您的最大下注金額為2.5美元。”

但現在他們找到了規避這一規則的方法。在開發出了整套系統后,他們現在提供訂閱服務。只需每月支付訂閱費用,訂閱者即可通過郵件收到相關信息,指導他們在軟博彩公司如何下注可以贏利。這意味著即使被禁止,揚和馬里烏斯也可以繼續獲利。這對除了莊家之外的所有參與者而言都是雙贏。業余賭博者可以得到長期贏利方案,而馬里烏斯和揚可以從中賺取傭金。

這就是我和他們二人坐在酒吧里的原因。他們已經掌握了自動收集數據和投注的技巧,而我的公式可以進一步提升他們的優勢:我的英超聯賽模型不僅可以擊敗“軟”博彩公司,還可以擊敗“硬”博彩公司。

此時此刻,我相信我已經找到了在即將到來的世界杯中取得優勢的辦法,但是我需要更多數據來檢驗我的假設。還沒等我說完自己的想法,揚就打開了筆記本電腦,試圖接入酒吧的無線網。他說:“我們可以從過去的8場大型國際比賽中得到合理的賠率,我有一些代碼可以替我們抓取這些數據。”

我們最后商量出了一個計劃,并確定好了執行該計劃所需的數據。揚在回到他的酒店后啟動了數據抓取程序,在夜里開始收集歷史賠率。

*

馬里烏斯和揚都是技術型職業賭徒。他們精通編程,知道如何獲取數據,并且懂數學。與老派的賭徒相比,他們的特點在于,他們通常對比賽項目本身不太感興趣,而是對數字更感興趣,但是他們對賺錢同樣感興趣,也更擅長。

我的下注方法成為這對搭檔的雷達,使我得以接近他們的賭博網絡。但是,當我詢問他們正在從事的其他項目時,他們給出了謹慎的回答,可見他們還沒有準備好接納我成為俱樂部的正式成員。起碼目前還沒有。我只是一個業余愛好者,當我說打算在我們正在開發的系統上投注50美元時,他們笑了笑,關于其他項目,他們透露給我的也僅僅是必需信息而已。

不過,在體育博彩行業我還有一個熟人,我們之間的交情更深一些。他近期離開了體育博彩行業,雖然他不想讓我透露他的身份以及他的雇主(下文中我們就稱他為詹姆斯),但他很樂于分享自己的經驗。

詹姆斯告訴我:“如果你真的有優勢,那么對你而言唯一能阻止你賺錢的因素就是下注的速度。”

為了弄明白詹姆斯的觀點,我們先來設想一個回報率為3%的傳統投資。如果你投注的總資本為1 000美元,那么一年后你將有1 030美元,獲利30美元。

現在我們假設用1 000美元來賭博,我們相對莊家有3%的優勢。你當然不想冒著輸掉所有錢的風險一次性投注所有資金,因此我們可以考慮先下注10美元,這樣風險相對適度。你不會每次都贏,但是3%的優勢意味著,平均而言,每10美元的賭注你將贏得30美分。因此,這一次投注相對于1 000美元的投資的回報率為0.03%。

要想得到30美元的利潤,你需要這樣下注100次。如果按每年下注100次來算,那就是每周大約兩次,比大多數人都要多。我們這些業余愛好者要清醒地認識到,即使你確實有優勢,作為一個從賭博中找樂子的業余愛好者,你也不能指望從1 000美元的投資中賺到多少錢。

與詹姆斯合作的不完全是業余愛好者。每天在世界各地進行的足球比賽輕輕松松就超過100場,揚下載了最近1 085個不同聯賽的數據。除了網球、橄欖球、賽馬,還有其他戶外運動,這里面到處都是賭博的機會。

現在讓我們想象一下,詹姆斯和他的同事只在足球比賽中占優勢,每天下注100場比賽,如此持續一年。我們還假設,隨著利潤的增加,他們下注的金額會隨著本金的增加而成比例增加,因此,一旦他們賺到了10 000美元,他們每次下的賭注就變成100美元。他們的資產到100 000美元之后,那每次的下注金額就變成1 000美元,依此類推。那么到年底,有3%優勢的賭徒究竟能賺多少?1 300、3 000、13 000還是310 000美元?

實際情況是到年底,他們的資產應該達到56 860 593.80美元,將近5 700萬美元!每次投注僅使資本增加0.000 3倍,但在投注36 500次后,指數增長的力量開始顯現,利潤急劇增加。2

但在實際中,這種增長水平是無法實現的。即使詹姆斯和他的前同事下注的“硬”莊家比“軟”莊家允許更大的賭注,這里面仍然存在局限性。詹姆斯告訴我:“倫敦的博彩公司發展迅速,規模龐大,他們現在必須通過經紀人才能下注。否則,如果每個人都知道他們在某場比賽上下注,那么其他人就會涌入市場,他們的優勢就會消失。”

盡管有這些限制,但是在公式的幫助下,這些博彩公司仍然賺得盆滿缽滿。只要看到博彩公司的辦公室內部裝飾有多豪華,就知道他們有多成功了。行業領頭羊之一足球雷達會為員工提供免費的早餐,他們可以隨意使用豪華健身房,休息的時候可以打打乒乓球或玩玩游戲機,可以得到他們需要或是想要的任何電腦設備。該公司還鼓勵數據科學家和軟件開發人員自己決定工作時間,并聲稱他們能提供與谷歌或臉書相似的能激發創造力的工作環境。

足球雷達的兩個主要競爭對手智率和星蜥也位于倫敦。這兩個公司的老板分別為馬修·貝納姆和托尼·布魯姆,他們都憑借過人的數字天賦做出了自己的事業。貝納姆曾就讀于牛津大學,在那里他開啟了基于統計學的賭博業務,而布魯姆則是一名職業撲克玩家。2009年,他們各自收購了家鄉的足球俱樂部,布魯姆買下了布萊頓足球俱樂部,貝納姆買下了布倫特福德足球俱樂部。貝納姆總能在博彩游戲中占先,他覺得不如買下一家公司更好,于是將“硬”博彩公司——火柴盒收入囊中。

貝納姆和布魯姆都利用大數據找到了小優勢,并獲得了巨額利潤。

我告訴揚和馬里烏斯的計算熱門球隊贏得世界杯比賽的概率公式如下:

其中x是莊家賦予被看好的球隊的賠率。這里的賠率用英國人慣用的方式給出,賠率為3∶2或者x=3/2意味著,如果投注成功,那么你每投注2美元能得到1美元的回報。

讓我們分析一下公式1的實際含義,首先從公式的左邊開始,我將其記為P(最熱門球隊奪冠)。數學模型從來不會給出關于輸和贏的絕對預測,通常它只會給出受歡迎球隊的獲勝概率,為0%到100%之間的一個數值,表達了對于預測結果的確信程度。

這個概率值取決于公式右邊的項,它包含三個字母,x是拉丁字母,α和β是希臘字母。曾經有一位學生告訴我,她覺得涉及拉丁字母x和y的數學計算直接而簡單,但是當我們開始用希臘字母α和β討論問題時,數學計算會變得尤為困難。對于數學家來說,這種說法有些好笑,因為x、y、α和β只是符號,它們不會使數學變得更簡單或者更困難,因此我當時認為這位學生只是在開玩笑。但她確實提出了一個重要的觀點:當α和β出現在公式中時,數學本身往往會變得更加困難。

我們首先去掉這些希臘字母,得到

這個公式變得簡單很多。如果賠率為3/2(按歐洲的通常記法是2.5,按美國的通常記法是+150),那么受歡迎球隊贏得比賽的概率為

事實上,這個公式表示了在沒有α和β的情況下,莊家對于熱門球隊的勝率的預測。他們覺得熱門球隊有2/5或者40%的概率獲勝。在另60%的情況下,該球隊要么平局,要么落敗。

在不考慮α和β(或者嚴格來說,令α和β都為1)的情況下,我的預測公式相當好理解,但是此時這個公式沒有任何的贏利能力。為了理解為什么,想象一下如果你給最熱門球隊投注了1美元會發生什么。如果莊家的賠率是正確的,那么平均來說5次中你有兩次能贏得1.5美元,其他3次則輸掉1美元。因此平均來說你能贏得

換句話說,這個公式告訴你,在多次投注后,平均來說你什么也得不到,凈賺額為零。而且在有些情況下可能更糟。開始的時候我假設莊家給出的賠率是公平的。3事實上,它們不可能是公平的。莊家總是會調整自己的賠率,以確保自己能獲利。因此,他們可能提供7/5的賠率,而不是3/2。因此除非你知道自己在做什么,否則這種調整意味著莊家永遠是贏家,而你會一直輸。如果是7/5的賠率,平均來說你每投一次注會輸掉4美分。4

擊敗莊家的唯一方法就是用數據說話,而這些數據正是揚離開酒吧后的那個晚上通過電腦抓取的數據。揚的程序收集了自2006年德國世界杯以來所有世界杯和歐洲杯比賽(包括預選賽)的賠率和結果。第二天早上,我們坐在我的大學辦公室里,開始尋找優勢。

我們首先加載了數據,并將其導入類似表1-1的電子表格中。

表1-1 2014年世界杯比賽的賠率、概率和賽果

根據這些歷史結果,我們可以通過比較表1-1數據的最后兩列來了解莊家給出的賠率到底有多準確。例如,在2014年世界杯西班牙和澳大利亞的比賽中,他們預測西班牙獲勝的可能性為73%,而他們確實預測對了。這可以被認為是“好”的預測。另一方面,他們預測意大利戰勝哥斯達黎加的概率為63%,但結果是哥斯達黎加贏了。這可以被認為是“壞”的預測。

我將這里的“好”和“壞”加了雙引號,因為沒有其他比賽結果供比較,所以我們無法真正評估預測的好壞程度。這就是α和β需要介入的地方,它們均為公式1中的參數。我們可以調整參數的值,利用它們,我們可以微調公式以使其更加精確。盡管我們無法更改西班牙對澳大利亞這場比賽的最終賠率,也無法影響這場比賽的結果,但我們可以選擇合適的α和β來得出比莊家更好的預測。

我們可以用邏輯回歸來尋找參數α和β最合適的取值。為了理解邏輯回歸是如何起作用的,我們可以先考慮如何通過調整β的值來優化對西班牙與澳大利亞比賽結果的預測。如果我們讓α為1,β=1.2,那么我們有

因為比賽最終結果是西班牙勝,所以這里得到的77%的概率比莊家的73%的預測要好。

但這里也存在一些問題:如果我增大β的值,那么在2014年英格蘭與烏拉圭的比賽中英格蘭勝的概率會從51%增加到52%,但是那場比賽中英格蘭落敗了。為了解決這個問題,我可以增大另一個參數,如令β=1.2,α=1.1。這樣一來,西班牙勝澳大利亞的概率為75%,英格蘭勝烏拉圭的概率為49%。相比于之前令α和β都等于1的情形,這兩個預測都更準確一些。

我們在上面嘗試對參數α和β做了調整,并將結果與兩場比賽的賽果進行了比較。揚的數據集則包括自2006年以來歷屆世界杯和歐洲杯的總計284場比賽。對于人類來說,不斷更新參數值,將其代入公式并查看這些調整是否能改善預測會非常耗時。但是,我們可以使用計算機算法來執行這項計算,這就是邏輯回歸的功能(參見圖1-1)。它系統地調整了α和β的值,并給出了盡可能接近實際比賽結果的預測。

我用Python編程語言編寫了一個腳本來執行計算,按下了“運行”,然后看著我的代碼處理所有數據。幾秒鐘后,我得到了一個結果:當α=1.16和β=1.25時,該模型給出的預測最為精確。

圖1-1 利用邏輯回歸設定參數為α=1.16和β=1.25

這些數據立即引起了我的注意。兩個參數α和β都大于1,這表明賠率與結果之間存在復雜的關系。理解這種復雜關系的最好方法是在電子表格中添加新列,將我們的邏輯回歸模型與博彩公司得出的預測進行比較。

表1-2 2014年世界杯比賽的賠率、概率、邏輯回歸模型概率和賽果

從這里我們可以看到,鐵桿賭徒口中的長期偏見現象總是會發生在西班牙這樣的熱門球隊身上。這些隊伍在莊家的賠率中通常是被低估的,因此值得下注。另一方面,像2014年的英格蘭這樣較弱的熱門球隊則被高估了。英格蘭的獲勝概率低于賠率所給出的數值。盡管預測和模型之間的差異很小,但揚、馬里烏斯和我都知道這足夠我們從中獲利。

我們在世界杯中發現了一個小優勢。但目前我們還不是很清楚在以往比賽中出現的優勢會不會出現在這屆世界杯上,因此我們可能得承受一些損失才能找到它。午餐時間,基于我的公式開發的交易系統正式投入使用。我們按下了“運行”,靜候結果。我們將在整個世界杯期間自動投注。

午餐后,我們一同回到了我的家。馬里烏斯和我坐在地下室,觀看烏拉圭對陣埃及的比賽。揚拿出他的筆記本電腦,開始下載網球的賠率數據。

*

我的投注公式不僅與一屆世界杯有關,它的目的也不只是從莊家那兒獲利。它真正的力量在于讓我們以概率的方式看待未來。使用投注公式意味著我們要拋開我們的第六感,并且不再對足球比賽、賽馬、財務投資、工作面試甚至浪漫約會的結果做百分百確定性的預測:你永遠無法知道下一步會發生什么。

我們大多數人都有一個模糊的理念,即未來要發生的事在很大程度上是由概率決定的。如果天氣預報告訴你明天有75%的可能性是晴天,那么即便你在上班途中遇到傾盆大雨,也不應該感到驚訝。但是要找出隱藏在概率背后的小優勢,就需要你對這個問題有更深的理解。

如果某個特定的結果對你很重要,那么請分別考慮一下該結果成功和失敗的可能性。近期我曾與一家非常成功的初創公司的首席執行官進行了交流,該公司已經過四輪數百萬美元的融資,并擁有100名員工。他坦言道,從長期來看,自己和投資者的獲利機會大約只有1/10。他每天花很長時間全身心地投入工作,但他同時也很清楚,自己目前擁有的這一切可能在一夜之間蕩然無存。

我們會發現找到夢寐以求的工作和理想的伴侶都很困難,生活中總有你無法控制的因素。看到那些在面試后覺得自己做錯了什么而捶胸頓足的人,我感到十分驚訝,這其實很可能只是由于當天面試的其他人表現得無可挑剔。請記住,走進辦公室面試之前你只有20%的成功率,如果不是連續五次面試都不過,那就沒什么理由對任何結果感到沮喪。5

我們很難去量化浪漫,但我們也可以在這里使用概率原則。不要指望第一次約會就能碰見真命天子,如果你連續34次約會都失敗,再花點兒時間反思一下自己也不遲。

確定了相關概率后,就要考慮它們與投資規模和潛在利潤之間的關系。我提倡用概率思考問題并不是要你逆來順受、認命并接受一切,也不是試圖讓你更加警覺。一個創業公司的首席執行官提出了成為下一個優步或愛彼迎的商業企劃,它有1/10的成功機會,這個商業企劃有可能建立一個價值100億美元的公司。100億除以10依然有10億,這仍然是一筆巨大的預期利潤。

從概率的角度考慮問題,需要你直面對你不利的可能性,更現實一些。在賽馬和足球比賽中,不成熟的賭徒往往會高估小概率事件的發生概率,但在現實生活中,我們往往會低估小概率事件的發生概率。人們天生謹慎并且傾向于規避風險,但請記住,得到你真正喜歡的工作或找到自己喜歡的伴侶所帶來的回報是巨大的。這意味著你需要冒很大的風險去追求預期目標。

*

數學需要付出努力和毅力。5分鐘前,我讀完了應用數學史上最杰出的論文之一,這篇論文價值10億美元。即使我一開始就了解到該論文對數學素養的要求很高,但看到公式時,我還是感到比想象中更加困難。我跳過了這些公式,并告訴自己讀完之后再來搞清楚推導過程,然后去讀有趣的部分。

我剛提到的那篇論文是威廉·本特(William Benter)的《基于計算機的賽馬預測和投注系統報告》。6這是一份宣言,從科學角度表達意向的聲明。這個嚴謹的人顯然對自己所做之事充滿信心,他詳細寫下計劃,再付諸實踐,他要向全世界表明,他能取得成功絕不是因為運氣,而是因為數學的確定性。

20世紀80年代末,威廉·本特開始橫掃香港賽馬場。在他開始這項計劃之前,高賭注的賭博一直是騙子的樂土。這些騙子通常會在跑馬地和沙田賽馬場以及皇家香港賽馬會附近徘徊,試圖從馬主、負責訓練的員工和教練那里收集內部信息。他們會發現某匹馬是否吃過早餐或秘密進行了額外的訓練等。他們和騎師成為朋友,并向他們咨詢比賽策略。

作為一名美國人,本特是這個賽馬世界的局外人,但他想到了另一種獲取內部信息的方法,這是騙子們不曾注意到的,盡管實際上它一直就躲在賽馬俱樂部的辦公室里。在兩位秘書的幫助下,本特拿到了賽道年鑒的副本,于是,他將賽馬成績輸入計算機。后來他告訴《彭博商業周刊》,他就是在那一刻取得了突破。他得到了最終賠率的數據,并將其數字化。正是這些賠率使本特能夠采用一種類似于我向揚和馬里烏斯展示的方法:利用公式投注。這是找出賭徒和情報販子的預測中的不正確之處的關鍵。

本特沒有止步于此。在上文中介紹的基本公式中,我僅僅確定了足球比賽賠率中的偏差。而現在,在仔細閱讀了本特的論文之后,我開始理解本特是如何在如此長的周期內贏利的了。在我自己的模型中,我沒有考慮影響比賽結果的其他因素。然而本特做的更多,他收集的數據包括每匹馬過去的表現、距離上次比賽的時間、馬的年齡、騎手的貢獻、指定的跑道、當地的天氣和許多其他因素,并將這些因素逐個添加到投注公式中。隨著他考慮的細節越來越多,邏輯回歸公式的準確性更高,預測結果也更精準。在輸入了5人年的數據后,他的模型日趨完善。他在賭場通過算牌籌集到足夠資金后,開始去跑馬場下注。

在開始投注的前幾個月,本特獲得了50%的利潤,但兩個月后,這些利潤又歸零了。在接下來的兩年中,本特的利潤起伏不定,有時接近100%,但隨后又下降到接近0。大約兩年半后,該模型才真正開始獲得回報,利潤逐漸上升到200%、300%、400%,然后呈指數式增長。本特告訴《彭博商業周刊》,在1990—1991賽季,他的利潤達到了300萬美元。7據《彭博商業周刊》預計,在接下來的20年中,本特和少數使用相同方法的競爭對手從香港賽馬場贏得的收入超過了10億美元。

本特的科研論文最不可思議的一點不是它的內容,而是很少有人閱讀這一事實。自發表以來的25年中,它被其他文章總共引用了92次。而我在15年前寫的一篇有關霸王蟻如何選擇新家的文章甚至還被引用了351次。

被忽視的不僅僅是本特的文章。本特在自己的文章中引用了露絲·博爾頓(Ruth Bolton)和蘭德爾·查普曼(Randall Chapman)于1986年撰寫的論文,并稱之為“必讀”論文8,這篇文章講的是如何使用押注公式在美國賽馬場中獲利。然而,將近35年后,這篇啟發性的論文被引用的次數還不到100次。

本特沒有接受過高等數學方面的正規教育,但是對于他所從事的工作來說已經足夠了。在其他人的描述里他被稱為天才,但我不這么認為。在我的職業生涯中,我遇到了許多不是天才也并非數學家的人,他們都系統學習過本特所使用的統計方法。他們大多數不是賭徒,而是使用統計數據檢驗假設的生物學家、經濟學家和社會學家,但是他們確實花了一些時間來理解數學。

第一次閱讀那篇論文的時候我并沒有理解其中的數學原理。實際上,只有為數不多的專業數學家能夠輕松閱讀和消化這些公式。通常來說,秘密就隱藏在這些細節里。

*

任何秘密組織面臨的最大威脅都是被公之于眾。光照會的成員認為世界事務都被精通技術的領導者所控制,其當代翻版[2]要求每個成員對他們的目標和方法保持沉默。如果某個人泄露了秘密或者計劃,那么整個組織都將面臨風險。

這種易于泄露的危險是大多數科學家不太相信光照會存在的主要原因,控制所有人類活動需要一個龐大的秘密組織和一個巨大的秘密。只要一個成員崩潰,就會帶來全員的暴露,這個風險太大了。

但是隨著我們深入研究投注公式,我們逐漸理解了拜十會的秘密是如何被隱藏的。只有當組織的成員堅持不懈地學習時,他們才會慢慢揭露其中的秘密。人們在學校中學習這個秘密,而且在大學的課程中得到延伸,只是我們都沒意識到自己學習的到底是什么。拜十會的成員只是模糊地意識到他們是這一巨大組織的一部分,他們沒有覺得自己隱藏了什么秘密,自然也沒有需要坦白的東西。

一名年輕的拜十會成員在讀了幾遍本特的學術論文后,努力去理解其中的含義。她覺察到了一種聯系,這種聯系已經存在了好幾個世紀。本特在研究露絲·博爾頓和蘭德爾·查普曼的文章時肯定覺察到了同樣的聯系。同樣,博爾頓和查普曼在研究戴維·考克斯的工作時也會有相同的感覺。考克斯在1958年提出了邏輯回歸方法,為博爾頓、查普曼和本特的工作奠定了基礎。繼續往前追溯的話,就到了兩次世界大戰時的莫里斯·肯德爾和羅納德·A.費希爾,以及18世紀生活在倫敦的亞伯拉罕·棣莫弗和托馬斯·貝葉斯第一次提出了概率論,數學產生的聯系貫穿了整個歷史。

隨著她逐漸深入研究細節,我們的年輕助教發現,所有秘密都隱藏在細節里,一步步地在她面前呈現出來。本特用公式的“密碼”記錄了他成功的起源,而在25年后的今天,年輕助教又從代數符號里重新感受到了那種成功。

所有這些公式的共同點是數學,它讓我們穿過遙遠的時空相遇。像她的前輩本特一樣,她開始了解到通過隱藏在數據中的統計關系(而不是第六感)來投注的美妙之處。

*

在不使用公式的前提下,還有一種方法可以解釋揚、馬里烏斯和我提出來的投注策略。事實上,我用一句話就能解釋其中的關鍵思想:我們發現世界杯的開場賠率(莊家在比賽開始前很久給出的賠率)比閉場賠率(莊家在比賽前一刻給出的賠率)能更好地預測結果。

這個結果是反直覺的。當莊家設定賠率時,開球前幾周(或幾個月)發生的事情存在很多不確定性。明星球員(比如埃及的穆罕默德·薩拉赫)可能會受傷,球隊的狀態可能不盡如人意(世界杯開賽前幾周,法國隊與美國隊戰平),或者可能在最后時刻更換主教練(如西班牙)。從理論上講,這些事件的發生應該會導致賠率發生變化,如果西班牙隊突然解雇主教練,其擊敗葡萄牙的賠率就會下降。

賠率的確變了,但是它們并不能反映真實情況,而是會矯枉過正。隨著比賽的臨近,業余賭徒涌入博彩市場并且開始下注,而莊家的賠率也會根據這些業余玩家所下的賭注發生變化。例如,法國隊擊敗秘魯的賠率原本為2/5,到第一場小組賽時則增至1/2。也許有些人會認為,如果法國隊在世界杯開賽前的友誼賽里沒能擊敗美國隊,那么秘魯可能在這場比賽中偷得1分甚至3分[3]。其他業余賭徒無疑讀到了報紙對中場球員保羅·博格巴的批評,并開始質疑他帶領國家隊抱走大力神杯的能力。無論是什么原因,這正是我們的模型在前幾屆世界杯中發現了可以產生不錯的收益的場景。當熱門隊的賠率增加時,支持熱門隊伍就會帶來優勢。我們的自動投注系統檢測到賠率的變化,激活了投注功能,并且在法國隊上下注50美元。而賽后我們的資產也確實變為75美元。這真是一個簡單有效的策略!

應用數學家的一項重要技能是解釋我們所使用模型背后的基本邏輯。在建立了模型后,我和馬里烏斯邊觀看下午的足球比賽邊討論為什么隨著世界杯比賽日的臨近,賠率變得越來越不準確。

他告訴我:“我們的大多數交易策略都基于這樣的想法,即越臨近比賽,賠率越精確。但世界杯比賽一定有一些不同之處。”

我推測說:“主要是絕對投注量上有所不同。電視上每天都會播放很多足球比賽,在這些比賽里小賭一下也很有意思。有些人押注是出于民族自豪感,而另一些人則希望將自豪感押到另一個國家身上。”

馬里烏斯認可了這一觀點。世界杯為足球帶來了新的觀眾群體,他們忍不住將錢花在自己支持的隊伍上。可以設想一下,一位忠實的英格蘭球迷可能會認為,投注法國隊輸會很有趣,這一考量也適用于阿根廷人和德國人在揭幕戰中支持瑞士而不是巴西。隨著大量的資金涌向較弱的球隊,莊家加大了熱門球隊的賠率,而我們的模式則受益于逆市而動。并不是每一場比賽都能給我們帶來收益,巴西一開場就意外戰平瑞士,但歷史表明,在開球前支持熱門球隊最有可能賺到錢。

業余參與者支持小概率事件帶來的偏差只是我們模型的一部分。我們的公式提供了更細致的預測:α=1.16和β=1.25表明當沒有非常強烈的偏好時,我們應該支持弱勢隊伍,我們在2014年英格蘭輸給烏拉圭的那場比賽中就看到了這一點。對哥倫比亞和日本的比賽的預測也比較準確。在比賽開始前的幾天,哥倫比亞隊獲勝的賠率從7/10增長到8/9。將這些賠率代入我們的公式可以看出,押注日本是有道理的。這不是因為日本更有可能贏得比賽,哥倫比亞仍然是熱門,而是投注公式表明,賠率為26/5的日本比哥倫比亞具有更好的投資價值。這一次我們賭對了,哥倫比亞輸了,我們下了50美元的賭注,贏得了260美元。

*

戴維·考克斯爵士現年95歲[4],至今仍然沒有停止研究。在長達80年的職業生涯中,他撰寫了317篇學術論文,而且未來還有可能發表更多。在牛津大學納菲爾德學院的辦公室里,他撰寫著現代統計學方面的評論和綜述,并在他的領域中做出新的貢獻。

我問他是否每天都去辦公室。

“不是每天,周末不去。”他回答。

然后他停頓了一下,斟酌了一下措辭:“應該說我周末去辦公室的可能性很小,但還是可能會去的。”

戴維·考克斯爵士做什么事都要求精確。他給我的回答是經過仔細考量的,并且總是會在力所能及的范圍內給出他對此的置信水平。

考克斯率先發現了投注公式。他自己不會這么承認,而且這個說法也不完全準確。更精確的說法是他發展了邏輯回歸理論,而我使用該理論找到了α和β的值,本特則用它來確定了哪些因素可以預測賽馬的結果。9他發展出了能讓投注公式做出更準確預測的統計方法。

邏輯回歸誕生于“二戰”后的英國。“二戰”即將結束時,考克斯爵士在劍橋大學完成了數學的學習,然后被借調到英國皇家空軍。后來,隨著英國開始戰后重建,他又轉去從事紡織業。他告訴我,他最初的興趣是抽象數學,但是這些經歷使他對新挑戰充滿了期待。他說:“紡織業中充滿了令人著迷的數學問題。”

雖然他對具體事件的記憶已有些模糊,但他對那些日子的熱情卻表露無遺。他談到如何通過測試材料的各項特征來預測其破裂的可能性,以及如何用粗紡羊毛制造出更堅固、更均質的產品等。這些工業上的問題,再加上他在皇家空軍遇到的有關空中事故頻率和機翼空氣動力學的問題,給了他很多思考的契機。

正是從這些實際問題出發,考克斯爵士提出了一個更為普遍的問題,也是一個更數學化的問題:當一個結果受多種因素的影響時,最佳的預測方法是什么(比如飛機失事是如何受風速影響的,或者毛毯是如何在應力應變的作用下被撕裂的)?這和本特對賽馬所進行的調查屬于同一類:根據一匹馬的比賽歷史和天氣預測它獲勝的概率。

“當我(于20世紀50年代中期)提出該理論時,大學里爭議最大的問題來自分析醫學和心理學的數據,這些數據被用來預測不同因素與醫學結果之間的關系,”考克斯告訴我,“我通過結合我的實踐經驗和數學背景提出了邏輯回歸,因此我應該可以用相似的數學函數解決醫學、心理學和工業領域的不同問題。”

事實證明,這一族數學函數比戴維·考克斯想象的還要重要。從20世紀50年代在工業領域的應用到對醫學試驗結果的解釋,邏輯回歸已成功被應用于無數不同的問題。臉書現在使用這種方法來決定向我們展示哪些廣告,聲破天(Spotify)用這種方法來推薦音樂,同時這種方法還構成了自動駕駛汽車行人檢測系統的一部分。當然,它也可以用于賭博……

我問過考克斯爵士他是否知道本特利用邏輯回歸方法在賽馬上取得的成功。他說沒有聽說過,于是我告訴他本特如何用邏輯回歸獲得了10億美元的收益。接著我還告訴了他關于牛津大學學生馬修·貝納姆的情況以及他在預測足球比賽結果方面的成功經驗。

“我希望你永遠都不要賭博。”他這樣告誡我,并停頓了很長時間。

然后,他平靜地給我講述了一個他聽到的賭博故事,是關于20世紀50年代時他的一位同事的,他要求我永遠不要泄密,我也遵守了諾言。

*

賭博并不是要預測未來,而是要找出你和他人看待世界方式的微小差異。如果你的視野比較清晰,如果你的參數可以更好地解釋數據,你就擁有了優勢。但也不要指望你的優勢能馬上顯現,你需要一步步地試錯,優化參數,才能逐步建立起優勢,而且也不要指望一直贏。事實上,只有在你一遍又一遍地玩著這個游戲的時候,你才能贏得比輸得多。

我們有時候喜歡去關注絕妙的想法。但是投注公式告訴我們,問題的關鍵在于創造不同的想法。想象一下,假如你要開一家瑜伽或者舞蹈教室,可以嘗試對不同的群體播放不同的伴奏音樂,并記錄哪種音樂效果最好。我們可以測試許多小點子,讓它們像跑馬場中的賽馬一樣相互競爭。在每次比賽結束時,我們都可以重新評估贏家和輸家,從中發現與成功或失敗相關的特征。

如果你想要嘗試新點子,那么你可以使用數據科學中常用的AB測試方法。網飛在更新網站設計時,會創造兩個或更多個版本(A、B、C等),展示給不同的用戶,然后測試哪種設計的點擊量最多。這是投注公式在確定設計特征成功還是失敗方面的直接應用,通過涌向網飛的信息流,人們能夠迅速了解到哪部分設計有用、哪部分沒用。

你無須搞清楚邏輯回歸背后的原理就能使用投注公式,但如果你掌握了調整參數、擬合數據的原理,再進一步去掌握邏輯回歸方法就變得非常容易了。戴維·考克斯爵士告訴我,他相信大多數人都能夠學會也應該學會如何使用他提出的方法。但如果只是為了理解你搜集的數據能揭示出什么,倒也無須掌握證明邏輯回歸模型有效的數學機理。

*

世界杯期間,我看了很多場足球比賽,但是由于我沒有按照賠率來買,所以我不知道精心計算的結果能否讓我賺錢,我只是很享受比賽的過程。揚一次又一次地給我發送自動生成的電子表格,其中包含下注列表以及可能的收益或損失。我們在小組賽的第一輪賭輸了,但是后來結果開始好轉,隨著比賽的進行,我們開始贏利。到世界杯結束時,我憑借總計1 400美元的賭注贏了近200美元,投資回報率為14%。

在研究了包含我們自己的數據的最新電子表格之后,我再次查看了收件箱中的消息,隨著世界杯的進行,這些消息變得越來越絕望:“我知道你有預測比分的方法,請你幫幫我!”“我想參考一下你的預測,我已經輸慘了。”“今天有一場大賭局,幫我贏點兒錢吧,有100來號人跟著我吃飯呢!”幾乎每時每刻我都能收到這類消息。

我不禁想到我們正是從這些沒多少錢的人身上賺取小額利潤的。莊家當然是最大的贏家,但是揚、馬里烏斯和我賺的是別人的錢,也許是從沒多少積蓄的人那里賺取的。

那時,一個想法開始在我的腦海中浮現:了解公式與不了解公式的人之間的不平等不僅僅存在于賭博上。戴維·考克斯爵士的統計模型適用于現代社會的許多方面,從羊毛工業和飛機設計到現代數據科學和人工智能,數學發展推動了技術進步,并且成為技術的基礎。這些進步只受到很小一部分人的控制:那些熟悉公式的人。在多數情況下,知道這些秘密的人因為擅長數學得到了社會地位和經濟利益。

戴維·考克斯也是拜十會成員,但他自己可能并不清楚這一點。他創造了其中一個公式,另外9個公式他也能夠完全掌握。因此他在拜十會中的地位是十分穩固的,而且是一位受人尊敬的最高等級的會員。

本特、貝納姆和布魯姆也是拜十會的一員,也許他們不像考克斯那樣是通過正式的數學教育了解到這些公式的,但是他們理解這些原則,也知道如何將這些原則付諸實踐。揚和馬里烏斯也正在通往拜十會的路上。

至于我,我是從學者的角度知道這些公式的,但同時我也像本特一樣清楚地知道如何在實際中使用這些公式。盡管我之前沒有意識到這一點,但我現在知道了,拜十會定義了我,不僅塑造了我的工作方式,而且定義了我是什么樣的一個人。


[1]本書英文版出版于2020年,作者與揚和馬里烏斯的會面在2018年世界杯開幕之前。——編者注

[2]指美國漫威漫畫系列中的“光照會”(Illuminati),由地球上最聰明、最富有的超級英雄組成。其成員的身份對外嚴格保密,連他們的家人和同為超級英雄的伙伴們都不知道有這個組織的存在。——編者注

[3]足球世界杯小組賽積分規則是勝者積3分、負者積0分、平局雙方各積1分。——編者注

[4]戴維·考克斯爵士生于1924年。——編者注

主站蜘蛛池模板: 聂拉木县| 鱼台县| 广汉市| 兴海县| 旬阳县| 会宁县| 湘乡市| 论坛| 安泽县| 太康县| 延庆县| 四平市| 阿拉尔市| 固始县| 汕头市| 留坝县| 金阳县| 扎兰屯市| 山东省| 麻阳| 太湖县| 永年县| 景洪市| 基隆市| 雅安市| 广安市| 甘德县| 吉木乃县| 峨眉山市| 崇阳县| 无极县| 庆安县| 盘锦市| 丹巴县| 商河县| 闻喜县| 双鸭山市| 凤凰县| 柯坪县| 察哈| 白城市|