官术网_书友最值得收藏!

3 如何對只有本人才知道的信息進行推斷?

通過飛機的引擎聲辨別機種

章魚哥以僅僅3.7%的驚人概率猜中了球賽的比賽結果,當我們聽到這則新聞的時候,可能沒有人會認為“章魚是通過可靠信息才猜中的”。但是,如果猜中比賽結果的是人呢?比如,某位紳士說“把我的眼睛蒙上,僅憑引擎聲,我就能辨別飛機的機種”,然后開始聽聲音辨機種。飛機的引擎聲里可能有某種一般人無法辨識的差異,所以當這個人連續猜中機種之后,我們就會說:“這個人的確有本事,他沒有唬人。”

不僅是猜飛機,鐵路迷們估計也能通過聽火車聲音分辨出不同車型的火車。

紅茶先還是牛奶先?猜猜看!

接下來,我要給大家講一個例子。

這是一個統計學里非常有名的故事,被稱為“紅茶夫人”。

英國有一位貴婦說:“奶茶的調制順序對風味有很大的影響,把紅茶加進牛奶里與把牛奶加進紅茶里,喝起來口味會完全不同。我能品出一杯奶茶是先倒的紅茶還是先倒的牛奶。”此言一出,身邊的紳士小姐們便開始議論紛紛。

絕大部分人都覺得這滑稽可笑:“這兩種混合方式的化學成分有什么差異嗎?紅茶加入牛奶里和牛奶加入紅茶里味道會有什么不同嗎?真是莫名其妙,開玩笑的吧!”

其中有一位紳士表現出了興趣,他提議說:“這可真是一個有趣的話題啊,我們不妨來試一試。”他認真地設計了實驗步驟,包括要準備多少杯紅茶、按照什么順序給這位貴婦喝等。這位紳士就是統計學的鼻祖羅納德·費希爾。

貴婦所說的究竟是真是假?她是確有這本事還是在開玩笑?這里就涉及“旁觀者如何根據觀察進行判斷”的問題(本書采用與費希爾不同的思考方式)。

啟示就來自章魚哥拉比奧。

旁觀者如何進行判斷?

:這個故事有趣吧。大和,你怎么看?

:學姐你先告訴我,思考這個紅茶故事有什么用處?

:有什么用處?你可真是性急啊!它可以運用到諸如設計安保系統或者AI聲控等復雜的工程上。但是,如果不懂其中的原理的話,就什么用處都沒有了。究竟有什么用,我們待會兒再說,先回到紅茶的話題上。

如果只用一杯紅茶來做實驗,那么貴婦不管是說真話還是撒謊,都只是一個二選一的問題,也就是說,回答正確的概率是1/2(50%)。想必“紅茶夫人”也不會為了賭這1/2的概率接受挑戰。

那么,連著做兩次實驗呢?她回答正確的概率就變成1/2×1/2=1/4,即25%了。就算這樣,也有可能在4次里有1次碰巧猜中,這還遠不能說服那些確信“這不可能是真的”的紳士小姐們。

那就連猜3次好了,猜中的概率變成1/2×1/2×1/2=1/8,即12.5%。3次嫌少就繼續猜第4次吧,概率變為1/6,即6.25%;連續5次猜中的概率為1/32, 即3.125%。6次、7次、8次呢?

究竟要做多少次實驗、連續猜中多少次才能讓人們相信她是真的有這個本事”呢?有沒有一個好的判定方法能為這無休無止的實驗做一個了斷呢?

非數學證明?

:如果是我的話,連續3次或4次猜中是先倒的紅茶還是先倒的牛奶,我就會折服了:“哇,調制順序不一樣,真的味道就不一樣哎,貴婦沒有撒謊!”那么,實際上究竟連續猜中多少次才能得到人們的認可,這需要通過數學方式來證明。

:哈哈!你在說什么呀?數學證明?那是不可能的。就算用最新的傳感器測試出了奶茶味道的不同,這里面仍然有一個問題,那就是,“貴婦是真的通過嘗出了味道的異同做出的判斷,還是隨便說說的”,對此我們該如何辨別?

最終,“是真的還是假的”,只有貴婦自己才知道,第三者是不可能“證明”什么的! 我想說的是,要找一個能從外部進行判別的方法。

:啊?這個我們怎么可能通過外觀來分辨呢?只有貴婦本人才知道吧。

有沒有一個被多數人“認可的界限”?

的確,正如大和所說,只有本人才知道的真偽,要讓我們這些旁觀者來進行正確與否的判斷,實在是太難了。或者說,這是不可能的。就算用上測謊儀,也不一定能百分之百判斷正確。

那可如何是好?

:我們可以用“畫線思維”。我再給你們一點提示,我們可以用“概率”來思考。“紅茶夫人”的故事,你們會不會覺得像是在做一個猜謎游戲?而這也正是現代統計學初始階段的重要主題。

我們在前文中說過,統計學大致分為“描述統計學”和推斷統計學”,現代統計學以推斷統計學為中心。推斷統計學以總體中的部分(樣本)為基礎,用隨機抽樣的數量特征信息來推斷總體的數量特征,從而做出具有一定可靠性保證的估計或檢驗。

這個話題我們到后文中再說,總之,還是先來聽聽兩個人的對話吧。

:現代統計學初始階段的重要主題?這么難的問題啊?我覺得對我來說就是猜謎。學姐,給點提示吧。

:好吧。首先要認識到根本就沒有百分之百猜對的情況。那我們是不是可以退而求其次,找一個讓大多數人都能接受的妥協點,也就是考慮一個能預計出的結論。

:妥協點?這的確跟數學沒啥關系了哈。

:就是大多數人都能接受的點。比如,如此小概率發生的事情,那就絕對不是“偶然事件”或“碰巧”了,必須得相信!也就是大多數人都能接受的一個程度,我們來定一下這個度吧。

:這個是人為決定的嗎?這么勉強,好意外哦。

:如果連續20次都猜對了,那概率就是百萬分之一了,這可是一個天文數字哦!這種情況,你還能說是偶然嗎?

:一百萬次才有一次正確?這樣的話誰都不會否認“紅茶夫人有真本事”了。百萬分之一,這概率也太低了,想要猜中一次的確是太難了。

:百萬分之一的概率,大和你應該承認“紅茶夫人”的本事了吧?那么,如果是萬分之一的概率呢?你還會這么想嗎?

:是的,萬分之一的概率,我也信。其他人也會這么想吧。

:那么,1%的概率呢?也信?好吧,那多大的概率你才會認為不是偶然、不是碰巧,而是憑本事的判斷呢?

:這個嘛, 10%?也就是10次里有1次猜對,呃,這好像要求有點兒太低了哈。那就5%吧,當出現20次里才有1次猜對的情況時,我會認為“偶然”的可能性很低。

“5%=20次里有1次猜對”的概率,就好像讓20人抽阿彌陀簽(日本常見的抽簽游戲),給其中唯一抽到簽的那個人發獎金,或者讓他在宴會上表演一樣,概率很低。下面就是一幅阿彌陀簽圖,相鄰的平行線間任意各畫兩條橫線。

詳細說明就此省去,不過,當阿彌陀簽的橫簽只有一根或者兩根的時候(這種情況很常見),如果事先知道一頭一尾數字對應的那根簽中簽的概率比較高的話,也許在實際抽簽時能有一定幫助哦。

是不是偶然,取決于這5%?

:5%嗎?從常識上來講是這樣的,統計學里也的確有一條5%的誤差線。所以,如果發生5%以內非常小概率的事情,我們就不認為這是偶然和碰巧了。相反,發生大于5%概率的事件,我們就會考慮這是偶然。

:哦哦,我明白了!4連中(1/16)的話,概率是6.15%,高于5%;5連中(1/32)的話,概率是3.125%,低于5%。這的確是非常嚴格的界定啊!如果在破5%之前出現了錯誤,“紅茶夫人”可能會為自己找個借口吧。www:她可能會說:“哈哈,開個玩笑罷了。英國紳士們都不知道這是在開玩笑嗎?”

與5%誤差線相對應,也可以說,只要是沒有進入95%的概率范圍即可。在“紅茶夫人”一例中,我們只是單方面考慮了她是否猜中,如下左圖,這在統計學里被稱為“單向檢驗”。

如果把持續偏差的小概率事件也一并考慮進去,那么,雙誤差率合為5%,這就是“雙向檢驗”了。是采用雙向檢驗還是單向檢驗,在判斷上會有截然不同的差異出現(本書不涉及“檢驗”內容)。

如果“紅茶夫人”連續5次(3.125%)猜中,從單向檢驗的角度來看(5%),的確可以認定“紅茶夫人”所言的正確性;但從雙向檢驗的角度來看,因為其概率為3.125%,沒有進入2.5%范圍,所以,如果再猜一次沒有猜中的話,她就不會被認可(“紅茶夫人”的例子里采用的是單向檢驗,不算嚴格)。

到底是采用單向檢驗還是雙向檢驗?哪種檢驗方法更合適?這在我們最初畫誤差線時,就有必要事先決定好。

不過,需要知道的是,無論概率多么低,都會有偶然連續命中的可能。所以,世上沒有100%的正確率,也沒有絕對的正確,這就是統計學的觀點。

總結

雖然沒有絕對,但我們可以定一條被大多數人接受的誤差線,統計學通常把這條誤差線畫在5%。

主站蜘蛛池模板: 普定县| 西吉县| 大丰市| 重庆市| 渑池县| 贵州省| 轮台县| 文登市| 青铜峡市| 沙湾县| 塔城市| 云梦县| 安化县| 翁源县| 通化市| 沐川县| 金堂县| 湖北省| 呈贡县| 石景山区| 二手房| 宜宾市| 宝丰县| 沂南县| 昌邑市| 广汉市| 宜州市| 河池市| 内江市| 峨山| 四川省| 廊坊市| 武陟县| 渭源县| 界首市| 清河县| 濉溪县| 文水县| 岐山县| 原平市| 绥棱县|