- Python廣告數(shù)據(jù)挖掘與分析實(shí)戰(zhàn)
- 楊游云 周健
- 141字
- 2021-04-02 14:21:18
2.3.2 箱形圖分析法
圖2-4所示為一個(gè)普通的箱形圖,當(dāng)樣本數(shù)據(jù)絕對(duì)值距離上(Q3)下(Q1)邊界大于1.5或3倍四分位距(IQR)時(shí),可以認(rèn)為該樣本為一個(gè)異常數(shù)據(jù)。

圖2-4 箱形圖
最小估計(jì)值:Q1+/-k(Q3-Q1)
最大估計(jì)值:Q3+/-k(Q3-Q1)
k為1.5時(shí),超過最大最小估計(jì)值的可以認(rèn)定為異常值;當(dāng)k為3時(shí),超過最大最小估計(jì)值的可以認(rèn)定為極端異常值。
推薦閱讀
- Visual Studio 2015 Cookbook(Second Edition)
- Creating Mobile Apps with Sencha Touch 2
- 數(shù)據(jù)庫系統(tǒng)原理及應(yīng)用教程(第4版)
- 大數(shù)據(jù)Hadoop 3.X分布式處理實(shí)戰(zhàn)
- 數(shù)據(jù)架構(gòu)與商業(yè)智能
- SQL應(yīng)用及誤區(qū)分析
- R語言數(shù)據(jù)挖掘
- Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第3版)
- 探索新型智庫發(fā)展之路:藍(lán)迪國際智庫報(bào)告·2015(上冊(cè))
- MySQL技術(shù)內(nèi)幕:SQL編程
- R Object-oriented Programming
- Expert Python Programming(Third Edition)
- R Machine Learning Essentials
- 大數(shù)據(jù)隱私保護(hù)技術(shù)與治理機(jī)制研究
- 大數(shù)據(jù)技術(shù)體系詳解:原理、架構(gòu)與實(shí)踐