- 統計學關我什么事:生活中的極簡統計學
- (日)小島寬之
- 996字
- 2019-01-04 22:38:40
1-3 第二步:設置發生“向店員詢問”事件的條件概率
在這一步,我們要做的是:為“來買東西的人”和“隨便逛逛的人”這兩類顧客分別設定“向店員詢問”的概率。如果沒有相關經驗和數據作為支撐,這項工作是無法完成的。上一節講到,即使沒有相關經驗,也可以設定先驗概率。但此處的“各個分類的行動概率”,必須是基于一定的經驗、實證、實驗的數值。
圖表1-2中的數值,是為了計算簡便而設定的,并非真實數據。
圖表1-2 關于“向店員詢問”這一行為的條件概率

從圖表1-2中可以看出,“來買東西的”顧客向店員詢問的概率是0.9,而“隨便逛逛的”顧客向店員詢問的概率只有0.3。
需要注意的是:圖表1-2從橫向來看,0.9+0.1=1,0.3+0.7=1,兩行都滿足標準化條件;而縱向來看,0.9+0.3≠1,也就是說并不滿足標準化條件。具體分析一下:橫向的一行,表示某一類別的顧客可能采取的兩種行動。比如第一行數字,表示“來買東西的人”向店員“詢問”或“不詢問”這兩種行為,顧客有可能詢問,也有可能不詢問,最終采取的行動一定是其中之一,沒有第三種可能性。而縱向來看,第一列數字表示,“來買東西的人”向店員詢問的概率為0.9,“隨便逛逛的人”向店員詢問的概率為0.3,兩個數字相加之和并不等于1。這是因為,對象范圍包含了兩個不同類別的顧客,并且也沒有涵蓋所有的行動。
圖表1-2中的數字,表示“某一特定類別采取各種行動的概率”,這在高等數學中被稱為“條件概率”。用“原因”的概念來解釋,即“在原因明確的情況下,某一類別采取各項行動的結果概率”(第15講中將介紹:如何用符號來表示條件概率)。
將兩個類別的顧客,進一步按照“詢問”和“不詢問”的條件來分類,那么前文所述的兩個大類別又可以細分為四個小類別,分別是:“來買東西的人詢問店員”“隨便逛逛的人詢問店員”“來買東西的人不詢問店員”“隨便逛逛的人不詢問店員”,如圖表1-3所示。
圖表1-3 四種互不相同的可能性

一共存在四種可能性:來買東西的人詢問店員(左上區域)、來買東西的人不詢問店員(左下區域)、隨便逛逛的人詢問店員(右上區域)、隨便逛逛的人不詢問店員(右下區域)。概率的具體計算方法將在第10講中具體介紹,此處對于結論先進行說明:各個區域所表示的概率與每個長方形的面積相等。長方形的面積可以用乘法求得,如圖表1-4所示。
圖表1-4 四種互不相同的可能性各自所對應的概率

下面我們來確認一下,這四個“可能世界”(所有可能發生的情況)的概率之和:
0.2×0.9=0.18 0.2×0.1=0.02
0.8×0.3=0.24 0.8×0.7=0.56
(0.18+0.02)+(0.24+0.56)=1