官术网_书友最值得收藏!

4.別相信直覺——概率論幫助偵破“財(cái)務(wù)造假”

· 本福特定律

法蘭克·本福特(Frank Benford,1883—1948)本來是一個(gè)美國電氣工程師,也是一名物理學(xué)家,在美國通用電氣公司實(shí)驗(yàn)室里工作多年直到退休。這位工程師在50多歲的時(shí)候,迷上了一個(gè)與概率有關(guān)的課題。課題得到的結(jié)論便是現(xiàn)在我們所說的“本福特定律”。事實(shí)上,本福特定律的最早發(fā)現(xiàn)者并不是本福特,而是美國天文學(xué)家西蒙·紐康(Simon Newcomb,1835—1909)。紐康于1877年成為美國航海天文歷編制局局長,并組織同行們重新計(jì)算主要的天文常數(shù)。繁雜的天文計(jì)算經(jīng)常需要用到對(duì)數(shù)表,但那個(gè)時(shí)代沒有互聯(lián)網(wǎng),沒有阿里云,對(duì)數(shù)表只能被印成書本存于圖書館中。細(xì)心的紐康發(fā)現(xiàn)一個(gè)奇怪的現(xiàn)象:對(duì)數(shù)表中包含以1開頭的數(shù)的那幾頁比其他頁破爛得多,似乎表明計(jì)算所用的數(shù)值中,首位數(shù)是1的概率更高。因此他在1881年發(fā)表了一篇文章,提到并分析了這個(gè)現(xiàn)象【4】,但沒有引起人們的注意。直到57年之后的1938年,本福特又重新發(fā)現(xiàn)這個(gè)現(xiàn)象。說來令人奇怪,科學(xué)定律的發(fā)現(xiàn)有時(shí)候來自于一些小得不能再小的現(xiàn)象,本福特的發(fā)現(xiàn)便是如此:以1開頭的數(shù)字比較多,這也算是一個(gè)定律嗎?本福特發(fā)現(xiàn)這種現(xiàn)象不僅僅存在于對(duì)數(shù)表中。也存在于其他多種數(shù)據(jù)中。于是,本福特檢查了大量數(shù)據(jù)而證實(shí)了這點(diǎn)【5】

本福特定律是一個(gè)乍聽起來有點(diǎn)奇怪并違反直覺的現(xiàn)象,我們舉一個(gè)例子說明它。

設(shè)想某銀行有1000多個(gè)存儲(chǔ)賬戶,金額不等。比如說,小張有存款23587元、老李1345元、小何35670元、劉紅9000元、王軍450元……奇怪的本福特定律不感興趣存款金額本身,而感興趣這些數(shù)值的開頭第一位有效數(shù)字是什么,有效數(shù)字指的是這個(gè)數(shù)的第一個(gè)非零數(shù)字。例如8.1、81、0.81的第一位有效數(shù)字都是8。比如說,剛才幾個(gè)人存款數(shù)的第一位數(shù)字分別是2、1、3、9、4。所以,本福特定律也叫“首位數(shù)字定律”。

一個(gè)數(shù)的第一位(非零)數(shù)字可能是1到9之間的任何一個(gè)。現(xiàn)在,如果我問,在剛才那個(gè)銀行的上千個(gè)存款數(shù)據(jù)中,第一位數(shù)字是1的概率是多大?

不需要經(jīng)過很多思考,大部分人都會(huì)很快地回答:應(yīng)該是1/9吧。因?yàn)閺?到9,9個(gè)數(shù)字排在第一位的概率是相等的,每一個(gè)數(shù)字出現(xiàn)的概率都是1/9,在11%左右。

這個(gè)聽起來十分正常的思維方法,卻與許多自然得到的數(shù)據(jù)所遵循的規(guī)律不一樣。人們發(fā)現(xiàn),很多情況下,第一個(gè)數(shù)字是1的概率要比靠直覺預(yù)料的11%大得多。數(shù)字越大,出現(xiàn)在第一位的概率就越小,數(shù)字9出現(xiàn)于第一位的概率只有4.6%左右。各個(gè)數(shù)字出現(xiàn)在第一位的概率遵循如圖1-4-1(a)所示的概率分布。

本福特和紐康都從數(shù)據(jù)中總結(jié)出首位數(shù)字為n的概率公式:Pn)=logd(1+1/n),其中d取決于數(shù)據(jù)使用的進(jìn)位制,對(duì)十進(jìn)制數(shù)據(jù)而言,d=10。因此,根據(jù)本福特定律,首位數(shù)是1的概率最大,log102=0.301,十成中占了三成;首位數(shù)是2的概率 log10(3/2)=0.1761;然后逐次減小,首位數(shù)是9的概率最小,只有4.6%。圖1-4-1(b)所示的是符合本福特首位數(shù)法則的幾個(gè)例子:人口統(tǒng)計(jì)、基本物理常數(shù)、斐波那契數(shù)、階乘。

圖1-4-1 本福特定律(首位數(shù)定律)及其應(yīng)用實(shí)例(彩圖附后)

本福特收集并研究了20229個(gè)統(tǒng)計(jì)數(shù)據(jù),分成20組,包括如河流面積、人口統(tǒng)計(jì)、分子及原子質(zhì)量、物理常數(shù)等多種來源的資料。數(shù)據(jù)來源雖然千差萬別,卻基本上符合本福特的對(duì)數(shù)法則,見表1-4-1所示的數(shù)據(jù)表。表中的最后一行數(shù)值,是根據(jù)本福特的對(duì)數(shù)規(guī)則計(jì)算得到的每個(gè)數(shù)字出現(xiàn)于首位的概率,讀者可以將它與真實(shí)數(shù)據(jù)相比較。

表1-4-1 本福特從大量數(shù)據(jù)中得到的首位數(shù)字概率表 %

本福特定律適用范圍異常廣泛,自然界和日常生活中獲得的大多數(shù)數(shù)據(jù)都符合這個(gè)定律。盡管如此,但畢竟還是有其應(yīng)用范圍,主要是受限于如下幾個(gè)因素:①這些數(shù)據(jù)必須跨度足夠大,樣本數(shù)量足夠多,數(shù)值大小相差幾個(gè)數(shù)量級(jí);②人為規(guī)則的數(shù)據(jù)不滿足本福特定律,比如說按照某種人為規(guī)則設(shè)計(jì)選定的電話號(hào)碼、身份證號(hào)碼、發(fā)票編號(hào),為造假而人工修改過的實(shí)驗(yàn)數(shù)據(jù)等,都不符合本福特定律。彩票上的隨機(jī)數(shù)據(jù)也不符合本福特定律。

· 如何理解本福特定律

盡管本福特和紐康都總結(jié)出了首位數(shù)字的對(duì)數(shù)規(guī)律,但并未給出證明。直到1995年美國學(xué)者泰德·黑爾(Ted Hill)才從理論上對(duì)該定律做出解釋,進(jìn)行了嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)證明【6】。雖然本福特定律在許多方面都得到了驗(yàn)證和應(yīng)用,但對(duì)于這種數(shù)字奇異現(xiàn)象人們依舊是迷惑不解。到底應(yīng)該如何直觀理解本福特定律?為什么大多數(shù)數(shù)據(jù)的首位數(shù)字不是均勻分布,而是對(duì)數(shù)分布的?

有人探求數(shù)“數(shù)”的方法,來直觀地理解本福特定律。他們的意思是說,當(dāng)你計(jì)算數(shù)字時(shí),順序總是從1開始,1,2,3, …,9,如果到9就終結(jié)的話,所有數(shù)起首的機(jī)會(huì)都相同,但9之后的兩位數(shù)10至19,以1起首的數(shù)則大大多于其他數(shù)字。之后,在9起首的數(shù)出現(xiàn)之前,必然會(huì)經(jīng)過一堆以2,3,4, …,8起首的數(shù)。如果這樣的數(shù)法有個(gè)終結(jié)點(diǎn),然后又重新從1開始的話,以1起首的數(shù)的出現(xiàn)率一般都應(yīng)該比較大。

可以用這種理解方法來解釋街道號(hào)碼(地址)一類的數(shù)據(jù)。一般來說,每條街道的號(hào)碼都是從1算起,街道長度有限,號(hào)碼排到某一個(gè)數(shù)就終止了。另一條街又有它自己的從1開始的號(hào)碼排列,這樣的話,看起來,1開頭的號(hào)碼是要多一些的。但這種解釋也太不“數(shù)學(xué)”了!況且,這種理解無法說明另一類數(shù)據(jù)為什么也符合本福特定律。比如說,“物理常數(shù)”的集合、出生率、死亡率等,就不是從1開始計(jì)算到有限長度就截止的那種數(shù)據(jù)了。

另一種解釋是認(rèn)為本福特定律的根源是由于數(shù)據(jù)的指數(shù)增長。指數(shù)增長的序列,數(shù)值小的時(shí)候增長較慢,由最初的數(shù)字1增長到另一個(gè)數(shù)字2,需要更多時(shí)間,所以出現(xiàn)率就更高了。舉個(gè)例子來深入說明這個(gè)道理,考慮你有100美元存到銀行里,年利是10%。在25年中,你每年的存款金額將是(美元,只保留了整數(shù)部分):

100、110、121、133、146、161、177、195、214、236、259、285、314、345、380、418、459、505、556、612、673、740、814、895、985

這是一個(gè)指數(shù)增長的序列。在這組數(shù)據(jù)的25個(gè)數(shù)中,首位數(shù)字為1的有8個(gè)(32%);2的4個(gè);3的3個(gè);…9的只有1個(gè)(4%)。那是因?yàn)閺氖孜粸?增加到首位為2,經(jīng)過了更長的時(shí)間(8年);從首位為2,只經(jīng)過4年就變成了首位為3;而首位為9的話,下一年就不是9了。所以,指數(shù)增長規(guī)律的數(shù)列的確符合本福特定律。

讀者也許會(huì)有疑問:你上面的數(shù)列選擇從100開始,1打頭的比較多,如果從別的數(shù)字開始,規(guī)律是否會(huì)改變呢?你可以試驗(yàn)一下,從別的數(shù)開始得到的數(shù)列,也一樣符合本福特法則。比如說,將以上銀行金額乘以2之后得到的序列:

200、220、242、266、292、322、354、390、428、472、518、570、628、690、760、836、918、1010、1112、1224、1346、1480、1628、1790、1970

以1開頭的有8個(gè),9開頭的只有1個(gè),仍然是1起頭的數(shù)目最多。或者,你也可以將美元換算成人民幣(比如說:乘以6.7),得到的數(shù)據(jù)仍然會(huì)遵循本福特定律,這些事實(shí)說明本福特定律具有“尺度不變性”。

· 幫助偵破“數(shù)據(jù)造假”

不管你如何詮釋本福特定律,它是一個(gè)客觀存在,并且十分有用!由于大多數(shù)財(cái)務(wù)方面的數(shù)據(jù),都滿足本福特定律,因此它可以用作檢查財(cái)務(wù)數(shù)據(jù)是否造假。

美國華盛頓州曾偵破過一個(gè)當(dāng)時(shí)最大的投資詐騙案,金額高達(dá)1億美元。詐騙主謀凱文·勞倫斯及其同伙,以創(chuàng)辦高技術(shù)含量的連鎖健身俱樂部為名,從五千多個(gè)投資者手中籌集了大量資金。然后,他們挪用公款來滿足自身享樂,為他們自己買豪宅、豪華汽車、珠寶等。為了掩飾他們的不法行為,他們將資金在海外公司和銀行間進(jìn)行頻繁轉(zhuǎn)賬,并且人為做假賬,給投資者造成生意興隆的錯(cuò)覺。所幸當(dāng)時(shí)有一位會(huì)計(jì)師感覺不對(duì)頭,他將七萬多個(gè)與支票和匯款有關(guān)的數(shù)據(jù)收集起來,將這些數(shù)據(jù)首位數(shù)字發(fā)生的概率與本福特定律相比較,發(fā)現(xiàn)這些數(shù)據(jù)通過不了本福特定律的檢驗(yàn)。最后經(jīng)過了3年的司法調(diào)查,終于拆穿了這個(gè)投資騙局。2002年,勞倫斯被判坐牢20年。

2001年,美國最大的能源交易商安然公司宣布破產(chǎn),并傳出公司高層管理人員涉嫌做假賬的傳聞。據(jù)說安然公司高層改動(dòng)過財(cái)務(wù)數(shù)據(jù),因而他們所公布的2001—2002年每股盈利數(shù)據(jù)不符合本福特定律(圖1-4-2)【7】。此外,本福特定律也被用于股票市場(chǎng)分析、檢驗(yàn)選舉投票欺詐行為等。

圖1-4-2 安然公司數(shù)據(jù)和本福特定律

(圖片來源:華爾街日?qǐng)?bào)【7】

美國稅務(wù)局也利用本福特定律來檢驗(yàn)報(bào)稅表,揪出逃稅、漏稅行為。據(jù)說有人曾經(jīng)用此定律來檢驗(yàn)美國前總統(tǒng)克林頓在任10年內(nèi)的報(bào)稅數(shù)據(jù),不過沒有發(fā)現(xiàn)破綻。

概率論由研究賭博問題而誕生,又在不斷地提出和解決各種有趣的賭博問題中發(fā)展起來。下一節(jié)中將介紹大數(shù)定律以及更多與賭博有關(guān)的概率問題。

主站蜘蛛池模板: 托克托县| 寻乌县| 丰台区| 石门县| 五华县| 长沙市| 涟源市| 柘荣县| 太康县| 广水市| 安泽县| 云南省| 汝阳县| 扶余县| 行唐县| 搜索| 普安县| 锦州市| 和静县| 江陵县| 阜新市| 自治县| 锡林浩特市| 毕节市| 达孜县| 洪洞县| 汝州市| 夏邑县| 黑水县| 通道| 卫辉市| 邵阳县| 贺兰县| 静宁县| 镇沅| 五寨县| 吉安县| 东明县| 新郑市| 齐河县| 威海市|