- 白話大數據與機器學習
- 高揚 衛崢 尹會生等
- 1216字
- 2019-01-03 16:36:46
3.3 小結
排列組合以及利用排列組合計算的古典概型在生產生活中可以解決很多問題。剛剛這些例子我們已經看到了不少用法和技巧。
在這里有幾個概念可能會被誤讀,我們需要在這里澄清一下。
最容易發生的誤解是,扔硬幣的時候,如果前3次出現“正”,那第4次出現“反”的概率就增大。
這里面的誤解我認為有兩個層面。
誤解1:對“概率”一詞本身的理解有偏差。
“概率”一詞的漢語含義是幾率、可能性、可能程度。我們通常會以我們自己臆想的方式去猜測某件事情的可能性比較高或者比較低,這會導致我們對概率大小理解的偏差。
在使用排列組合與古典概型的方法時,有一個大原則就是這些概率實際上是通過統計計算出來的,請注意,由統計得出概率是人們得到概率最原始的方法,包括后面將要介紹的條件概率也是一樣的道理。也就是說,硬幣扔出正面和反面各50%的概率是多少,這不是因為硬幣本身有兩個面,而是通過多次扔硬幣,然后用得到正面的次數除以總數得到扔出正面的概率——這個才是定義。而如果硬幣本身不是勻質的,如由于圖案雕花構造或者鑄幣金屬本身的特性導致正面較重,反面較輕,很有可能導致扔出正面的概率為60%,反面的概率為40%的情況(抑或其他比例)。請注意,這個結論同樣是通過多次扔硬幣得出來的,例如扔1000次,發現有600次是正面,400次是反面。這時再計算扔3次硬幣會產生3個正面的概率就不是3個1/2相乘了,而是3個0.6相乘了。
既然如此,概率本身的解釋就是對于大量樣本分布比例的解釋,而不是對單次事件的可能性的解釋。我們說扔硬幣產生正面概率50%,反面概率50%,其實是在說扔1000次硬幣,理論上會有500次產生正面,500次產生反面;扔10000次硬幣,理論上會有5000次產生正面,5000次產生反面。這才是概率本身的含義,而對于單次扔硬幣的解釋沒有意義。
誤解2:事件之間的獨立性。
扔出一次硬幣,得到正面,下一次重新再扔,那么這一次扔硬幣和上一次扔硬幣有關系嗎?學過概率論的朋友都不會陌生,答案是“沒有關系”。沒學過概率論的朋友其實稍微想一想也能得出這個結論。
這里不妨再做一個實驗,這個實驗略顯復雜且無厘頭,但是這個過程大家想想很快能想明白。
讓100個人,每個人都手持一枚同款勻質硬幣,讓他們各自開始扔,一次、兩次、三次……任何一個人都是一直在扔硬幣直到出現最近3次連續都是正面的時候停下來。最后,這100個人都會在那里靜靜地停下來等待下一個指令,這個指令就是讓他們同時進行一次拋硬幣的動作,然后比較這100枚硬幣正反面出現的比例。對于每一位參與實驗的人來說,如果由于前3次投擲都產生正面而使得第4次投擲出現反面的概率變高的話,那么會在100人同時投擲的實驗中看到一個奇怪的現象,那就是出現反面比正面多很多的情況。真的會這樣嗎?人們甚至還可以觀察更為極端的情況,那就是等待最近5次連續都是正面的時候停下來,結果又當如何?如果在一個試驗中直接扔100枚硬幣,那么產生正面和反面應該都是50次左右。這又和剛剛的假設看上去如此矛盾。究竟哪種說法是對的呢?統計的定義交給統計來驗證吧。
- Hands-On Data Structures and Algorithms with Rust
- 信息系統與數據科學
- 新型數據庫系統:原理、架構與實踐
- Live Longer with AI
- 區塊鏈:看得見的信任
- Microsoft Power BI數據可視化與數據分析
- Spark大數據編程實用教程
- 數據中心數字孿生應用實踐
- Python數據分析與數據化運營
- Hadoop大數據開發案例教程與項目實戰(在線實驗+在線自測)
- Oracle高性能SQL引擎剖析:SQL優化與調優機制詳解
- Mastering ROS for Robotics Programming(Second Edition)
- Spring MVC Beginner’s Guide
- 大數據與機器學習:實踐方法與行業案例
- 數據中心經營之道