- Python廣告數(shù)據(jù)挖掘與分析實(shí)戰(zhàn)
- 楊游云 周健
- 302字
- 2021-04-02 14:21:19
2.6 本章小結(jié)
本章首先介紹了廣告數(shù)據(jù)的特點(diǎn)及廣告數(shù)據(jù)分析的意義,然后分別介紹了六種常見(jiàn)的數(shù)據(jù)分布,包括伯努利分布、均勻分布、二項(xiàng)分布、正態(tài)分布、泊松分布、指數(shù)分布以及它們各自的特點(diǎn)。本章還介紹了兩種常用的異常值診斷方法,即三倍標(biāo)準(zhǔn)差法和箱形圖分析法,通過(guò)異常值診斷方法可以快速發(fā)現(xiàn)數(shù)據(jù)中的異常值。考慮到在廣告數(shù)據(jù)分析中經(jīng)常要對(duì)變量的相關(guān)性進(jìn)行分析,本章介紹了兩種常用的二元變量相關(guān)系數(shù):Pearson相關(guān)系數(shù)和Spearman秩相關(guān)系數(shù)。通過(guò)相關(guān)性分析可以快速找到變量之間的內(nèi)在聯(lián)系。最后還介紹了數(shù)據(jù)顯著性檢驗(yàn)的一般方法和步驟。總體來(lái)說(shuō),本章重點(diǎn)是向讀者介紹廣告數(shù)據(jù)的特點(diǎn)、分布以及數(shù)據(jù)分析中常用的觀察指標(biāo),為后續(xù)學(xué)習(xí)其他章節(jié)做鋪墊。
推薦閱讀
- 公有云容器化指南:騰訊云TKE實(shí)戰(zhàn)與應(yīng)用
- Spark快速大數(shù)據(jù)分析(第2版)
- Hadoop大數(shù)據(jù)實(shí)戰(zhàn)權(quán)威指南(第2版)
- 金融商業(yè)算法建模:基于Python和SAS
- Flutter Projects
- 大數(shù)據(jù)治理與安全:從理論到開(kāi)源實(shí)踐
- Chef Essentials
- Mastering ROS for Robotics Programming(Second Edition)
- 中國(guó)云存儲(chǔ)發(fā)展報(bào)告
- MySQL數(shù)據(jù)庫(kù)應(yīng)用與管理
- 區(qū)塊鏈應(yīng)用開(kāi)發(fā)指南:業(yè)務(wù)場(chǎng)景剖析與實(shí)戰(zhàn)
- Artificial Intelligence for Big Data
- 基于數(shù)據(jù)發(fā)布的隱私保護(hù)模型研究
- Access 2010數(shù)據(jù)庫(kù)應(yīng)用技術(shù)教程(第二版)
- SQL Server 2012 數(shù)據(jù)庫(kù)教程(第3版)