- Python廣告數(shù)據(jù)挖掘與分析實戰(zhàn)
- 楊游云 周健
- 238字
- 2021-04-02 14:21:18
2.3.1 三倍標準差法
前面我們介紹過,正態(tài)分布的函數(shù)圖像關于平均值x=μ對稱,且平均值與它的眾數(shù)及中位數(shù)是同一個數(shù),如圖2-3所示。
如圖2-3所示,正態(tài)分布函數(shù)曲線有以下幾個特點:
·68.2%的面積在平均數(shù)左右一個標準差(1σ)范圍內(nèi);
·95.4%的面積在平均數(shù)左右兩個標準差(2σ)的范圍內(nèi);
·99.7%的面積在平均數(shù)左右三個標準差(3σ)的范圍內(nèi)。

圖2-3 正態(tài)分布函數(shù)圖像
如果數(shù)據(jù)服從正態(tài)分布,那么當樣本數(shù)據(jù)絕對值大于3倍標準差時,可以基本認定該樣本為一個異常數(shù)據(jù),這也是我們在判斷廣告數(shù)據(jù)異常值中應用的有效手段之一。
推薦閱讀
- 信息系統(tǒng)與數(shù)據(jù)科學
- SQL Server 2008數(shù)據(jù)庫應用技術(第二版)
- Learning JavaScriptMVC
- R數(shù)據(jù)科學實戰(zhàn):工具詳解與案例分析(鮮讀版)
- 數(shù)據(jù)庫設計與應用(SQL Server 2014)(第二版)
- 新手學會計(2013-2014實戰(zhàn)升級版)
- 聯(lián)動Oracle:設計思想、架構實現(xiàn)與AWR報告
- 企業(yè)主數(shù)據(jù)管理實務
- Deep Learning with R for Beginners
- 算力經(jīng)濟:從超級計算到云計算
- MySQL技術內(nèi)幕:InnoDB存儲引擎
- 數(shù)據(jù)應用工程:方法論與實踐
- 數(shù)據(jù)之美:一本書學會可視化設計
- Artificial Intelligence for Big Data
- 基于數(shù)據(jù)發(fā)布的隱私保護模型研究