舉報

會員
大數(shù)據(jù)分析與挖掘
石勝飛 著
更新時間:2020-09-24 12:36:56
開會員,本書免費讀 >
最新章節(jié):
作者簡介
《大數(shù)據(jù)分析與挖掘》主要內(nèi)容包括:第1章緒論、第2章數(shù)據(jù)特征分析與預(yù)處理、第3章關(guān)聯(lián)規(guī)則挖掘、第4章分類算法、第5章聚類算法、第6章分布式大數(shù)據(jù)流挖掘、第7章綜合案例——基于華為技術(shù)與設(shè)備。本書可作為高等院校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、計算機科學(xué)與技術(shù)等相關(guān)專業(yè)的本科生教材。
最新章節(jié)
- 作者簡介
- 參考文獻
- 附錄 《大數(shù)據(jù)分析與挖掘》配套實驗課程方案簡介
- 6.8 習(xí)題
- 6.7.4 Spark異常值檢測實例
- 6.7.3 異常檢測應(yīng)用實例——時空異常檢測
品牌:人郵圖書
上架時間:2020-09-24 12:34:33
出版社:人民郵電出版社
本書數(shù)字版權(quán)由人郵圖書提供,并由其授權(quán)上海閱文信息技術(shù)有限公司制作發(fā)行
- 作者簡介 更新時間:2020-09-24 12:36:56
- 參考文獻
- 附錄 《大數(shù)據(jù)分析與挖掘》配套實驗課程方案簡介
- 6.8 習(xí)題
- 6.7.4 Spark異常值檢測實例
- 6.7.3 異常檢測應(yīng)用實例——時空異常檢測
- 6.7.2 基于有監(jiān)督學(xué)習(xí)的異常檢測實例
- 6.7.1 罕見類別檢測
- 6.7 其他有監(jiān)督學(xué)習(xí)類型的檢測算法
- 6.6.2 應(yīng)用實例
- 6.6.1 基本原理
- 6.6 基于集成學(xué)習(xí)的異常檢測算法
- 6.5 基于主成分分析的異常檢測算法
- 6.4.2 應(yīng)用實例
- 6.4.1 基本原理
- 6.4 基于One-Class SVM的異常檢測算法
- 6.3.3 應(yīng)用實例
- 6.3.2 異常檢測
- 6.3.1 基本定義
- 6.3 局部異常因子算法
- 6.2.4 應(yīng)用實例
- 6.2.3 隔離森林算法
- 6.2.2 隔離森林的特點
- 6.2.1 隔離與隔離樹iTree
- 6.2 基于隔離森林的異常檢測算法
- 6.1.4 異常檢測算法分類
- 6.1.3 異常檢測問題的特點
- 6.1.2 異常檢測評價指標
- 6.1.1 相關(guān)統(tǒng)計學(xué)概念
- 6.1 預(yù)備知識
- 第6章 數(shù)據(jù)挖掘綜合應(yīng)用:異常檢測
- 習(xí)題
- 5.10.6 Calinski-Harabz指數(shù)
- 5.10.5 輪廓系數(shù)
- 5.10.4 Fowlkes-Mallows評分
- 5.10.3 同質(zhì)性、完整性以及調(diào)和平均
- 5.10.2 互信息評分
- 5.10.1 調(diào)整蘭德指數(shù)
- 5.10 聚類算法評價指標
- 5.9.4 改進的Mean Shift算法
- 5.9.3 Mean Shift聚類算法實踐
- 5.9.2 Mean Shift算法聚類過程
- 5.9.1 基本概念
- 5.9 Mean Shift聚類算法
- 5.8.2 CLIQUE算法
- 5.8.1 STING算法
- 5.8 基于網(wǎng)格的聚類算法
- 5.7.4 BIRCH算法
- 5.7.3 層次聚類算法的性質(zhì)
- 5.7.2 聚類之間距離的度量方法
- 5.7.1 凝聚的層次聚類算法
- 5.7 層次聚類
- 5.6.3 GMM算法實踐
- 5.6.2 GMM算法的參數(shù)估計
- 5.6.1 算法原理
- 5.6 基于模型的聚類算法:高斯混合模型算法
- 5.5.2 OPTICS算法
- 5.5.1 DBSCAN算法
- 5.5 基于密度的聚類算法
- 5.4.6 數(shù)據(jù)流K均值算法
- 5.4.5 K中心點算法
- 5.4.4 K均值++算法
- 5.4.3 小批量K均值算法
- 5.4.2 二分K均值聚類算法
- 5.4.1 K均值算法
- 5.4 基于劃分的聚類算法
- 5.3.10 漢明距離
- 5.3.9 杰卡德距離
- 5.3.8 斜交空間距離
- 5.3.7 馬氏距離
- 5.3.6 蘭氏距離
- 5.3.5 余弦相似度
- 5.3.4 切比雪夫距離
- 5.3.3 曼哈頓距離
- 5.3.2 歐式距離
- 5.3.1 冪距離
- 5.3 距離度量
- 5.2 聚類算法的分類
- 5.1 聚類分析概述
- 第5章 聚類算法
- 習(xí)題
- 4.6.6 梯度提升決策樹
- 4.6.5 決策樹回歸
- 4.6.4 邏輯回歸
- 4.6.3 多項式回歸
- 4.6.2 嶺回歸
- 4.6.1 線性回歸
- 4.6 回歸分析
- 4.5 分類器算法的評估
- 4.4.3 隨機森林
- 4.4.2 Bagging算法
- 4.4.1 Adaboost算法
- 4.4 組合分類算法
- 4.3.3 基于案例的推理
- 4.3.2 局部加權(quán)回歸
- 4.3.1 KNN分類器
- 4.3 基于實例的分類算法
- 4.2.6 貝葉斯網(wǎng)絡(luò)推理實例
- 4.2.5 通過貝葉斯網(wǎng)絡(luò)判斷條件獨立
- 4.2.4 貝葉斯網(wǎng)絡(luò)基礎(chǔ)
- 4.2.3 樸素貝葉斯分類器
- 4.2.2 極大似然估計
- 4.2.1 貝葉斯決策理論
- 4.2 貝葉斯分類器
- 4.1.12 幾種屬性選擇度量的對比
- 4.1.11 決策樹的生成與可視化
- 4.1.10 決策樹后剪枝策略
- 4.1.9 過擬合與決策樹剪枝
- 4.1.8 CART算法
- 4.1.7 C4.5算法
- 4.1.6 信息論在ID3算法中的應(yīng)用
- 4.1.5 ID3算法
- 4.1.4 信息論的有關(guān)概念
- 4.1.3 決策樹的構(gòu)造過程
- 4.1.2 決策樹的類型
- 4.1.1 決策樹簡介
- 4.1 決策樹算法
- 第4章 分類與回歸算法
- 習(xí)題
- 3.7.4 優(yōu)化的關(guān)聯(lián)規(guī)則
- 3.7.3 局部化的關(guān)聯(lián)規(guī)則
- 3.7.2 時態(tài)關(guān)聯(lián)規(guī)則
- 3.7.1 量化關(guān)聯(lián)規(guī)則
- 3.7 其他類型關(guān)聯(lián)規(guī)則簡介
- 3.6.3 與其他序列模式挖掘算法的比較和分析
- 3.6.2 PrefixSpan算法
- 3.6.1 序列模式的定義
- 3.6 序列模式挖掘
- 3.5 多層關(guān)聯(lián)規(guī)則挖掘算法
- 3.4 結(jié)合相關(guān)性分析的關(guān)聯(lián)規(guī)則
- 3.3.2 Spark上FP-Growth算法實踐
- 3.3.1 FP-Growth算法
- 3.3 不需要產(chǎn)生候選項集的頻繁模式挖掘算法
- 3.2.3 事務(wù)數(shù)據(jù)的存儲
- 3.2.2 基于劃分的算法
- 3.2.1 Apriori算法
- 3.2 基于候選項產(chǎn)生—測試策略的頻繁模式挖掘算法
- 3.1 基本概念
- 第3章 關(guān)聯(lián)規(guī)則挖掘
- 習(xí)題
- 2.5.10 類別特征索引
- 2.5.9 特征向量合并
- 2.5.8 標準化
- 2.5.7 多項式擴展
- 2.5.6 正則化
- 2.5.5 最小—最大變換
- 2.5.4 最大絕對值標準化
- 2.5.3 哈達瑪積變換
- 2.5.2 分箱器
- 2.5.1 二值化
- 2.5 Spark數(shù)據(jù)預(yù)處理功能簡介
- 2.4.4 數(shù)據(jù)清洗
- 2.4.3 主成分分析
- 2.4.2 數(shù)據(jù)抽樣技術(shù)
- 2.4.1 數(shù)據(jù)變換、離散化與編碼
- 2.4 數(shù)據(jù)預(yù)處理
- 2.3.2 卡方(χ2)檢驗
- 2.3.1 相關(guān)分析
- 2.3 數(shù)據(jù)的相關(guān)分析
- 2.2.4 數(shù)據(jù)分布特征的可視化
- 2.2.3 數(shù)據(jù)分布形態(tài)的度量
- 2.2.2 描述數(shù)據(jù)離中趨勢的度量
- 2.2.1 描述數(shù)據(jù)集中趨勢的度量
- 2.2 數(shù)據(jù)的描述性特征
- 2.1.2 數(shù)據(jù)屬性的類型
- 2.1.1 數(shù)據(jù)集類型
- 2.1 數(shù)據(jù)類型
- 第2章 數(shù)據(jù)特征分析與預(yù)處理
- 1.4.3 華為云的機器學(xué)習(xí)服務(wù)
- 1.4.2 Spark ML
- 1.4.1 Sklearn
- 1.4 大數(shù)據(jù)分析與挖掘工具
- 1.3 大數(shù)據(jù)分析與挖掘主要技術(shù)
- 1.2 大數(shù)據(jù)應(yīng)用及挑戰(zhàn)
- 1.1 大數(shù)據(jù)分析與挖掘簡介
- 第1章 緒論
- 前言
- 叢書序二
- 叢書序一
- 編委會
- 內(nèi)容提要
- 版權(quán)頁
- 封面
- 封面
- 版權(quán)頁
- 內(nèi)容提要
- 編委會
- 叢書序一
- 叢書序二
- 前言
- 第1章 緒論
- 1.1 大數(shù)據(jù)分析與挖掘簡介
- 1.2 大數(shù)據(jù)應(yīng)用及挑戰(zhàn)
- 1.3 大數(shù)據(jù)分析與挖掘主要技術(shù)
- 1.4 大數(shù)據(jù)分析與挖掘工具
- 1.4.1 Sklearn
- 1.4.2 Spark ML
- 1.4.3 華為云的機器學(xué)習(xí)服務(wù)
- 第2章 數(shù)據(jù)特征分析與預(yù)處理
- 2.1 數(shù)據(jù)類型
- 2.1.1 數(shù)據(jù)集類型
- 2.1.2 數(shù)據(jù)屬性的類型
- 2.2 數(shù)據(jù)的描述性特征
- 2.2.1 描述數(shù)據(jù)集中趨勢的度量
- 2.2.2 描述數(shù)據(jù)離中趨勢的度量
- 2.2.3 數(shù)據(jù)分布形態(tài)的度量
- 2.2.4 數(shù)據(jù)分布特征的可視化
- 2.3 數(shù)據(jù)的相關(guān)分析
- 2.3.1 相關(guān)分析
- 2.3.2 卡方(χ2)檢驗
- 2.4 數(shù)據(jù)預(yù)處理
- 2.4.1 數(shù)據(jù)變換、離散化與編碼
- 2.4.2 數(shù)據(jù)抽樣技術(shù)
- 2.4.3 主成分分析
- 2.4.4 數(shù)據(jù)清洗
- 2.5 Spark數(shù)據(jù)預(yù)處理功能簡介
- 2.5.1 二值化
- 2.5.2 分箱器
- 2.5.3 哈達瑪積變換
- 2.5.4 最大絕對值標準化
- 2.5.5 最小—最大變換
- 2.5.6 正則化
- 2.5.7 多項式擴展
- 2.5.8 標準化
- 2.5.9 特征向量合并
- 2.5.10 類別特征索引
- 習(xí)題
- 第3章 關(guān)聯(lián)規(guī)則挖掘
- 3.1 基本概念
- 3.2 基于候選項產(chǎn)生—測試策略的頻繁模式挖掘算法
- 3.2.1 Apriori算法
- 3.2.2 基于劃分的算法
- 3.2.3 事務(wù)數(shù)據(jù)的存儲
- 3.3 不需要產(chǎn)生候選項集的頻繁模式挖掘算法
- 3.3.1 FP-Growth算法
- 3.3.2 Spark上FP-Growth算法實踐
- 3.4 結(jié)合相關(guān)性分析的關(guān)聯(lián)規(guī)則
- 3.5 多層關(guān)聯(lián)規(guī)則挖掘算法
- 3.6 序列模式挖掘
- 3.6.1 序列模式的定義
- 3.6.2 PrefixSpan算法
- 3.6.3 與其他序列模式挖掘算法的比較和分析
- 3.7 其他類型關(guān)聯(lián)規(guī)則簡介
- 3.7.1 量化關(guān)聯(lián)規(guī)則
- 3.7.2 時態(tài)關(guān)聯(lián)規(guī)則
- 3.7.3 局部化的關(guān)聯(lián)規(guī)則
- 3.7.4 優(yōu)化的關(guān)聯(lián)規(guī)則
- 習(xí)題
- 第4章 分類與回歸算法
- 4.1 決策樹算法
- 4.1.1 決策樹簡介
- 4.1.2 決策樹的類型
- 4.1.3 決策樹的構(gòu)造過程
- 4.1.4 信息論的有關(guān)概念
- 4.1.5 ID3算法
- 4.1.6 信息論在ID3算法中的應(yīng)用
- 4.1.7 C4.5算法
- 4.1.8 CART算法
- 4.1.9 過擬合與決策樹剪枝
- 4.1.10 決策樹后剪枝策略
- 4.1.11 決策樹的生成與可視化
- 4.1.12 幾種屬性選擇度量的對比
- 4.2 貝葉斯分類器
- 4.2.1 貝葉斯決策理論
- 4.2.2 極大似然估計
- 4.2.3 樸素貝葉斯分類器
- 4.2.4 貝葉斯網(wǎng)絡(luò)基礎(chǔ)
- 4.2.5 通過貝葉斯網(wǎng)絡(luò)判斷條件獨立
- 4.2.6 貝葉斯網(wǎng)絡(luò)推理實例
- 4.3 基于實例的分類算法
- 4.3.1 KNN分類器
- 4.3.2 局部加權(quán)回歸
- 4.3.3 基于案例的推理
- 4.4 組合分類算法
- 4.4.1 Adaboost算法
- 4.4.2 Bagging算法
- 4.4.3 隨機森林
- 4.5 分類器算法的評估
- 4.6 回歸分析
- 4.6.1 線性回歸
- 4.6.2 嶺回歸
- 4.6.3 多項式回歸
- 4.6.4 邏輯回歸
- 4.6.5 決策樹回歸
- 4.6.6 梯度提升決策樹
- 習(xí)題
- 第5章 聚類算法
- 5.1 聚類分析概述
- 5.2 聚類算法的分類
- 5.3 距離度量
- 5.3.1 冪距離
- 5.3.2 歐式距離
- 5.3.3 曼哈頓距離
- 5.3.4 切比雪夫距離
- 5.3.5 余弦相似度
- 5.3.6 蘭氏距離
- 5.3.7 馬氏距離
- 5.3.8 斜交空間距離
- 5.3.9 杰卡德距離
- 5.3.10 漢明距離
- 5.4 基于劃分的聚類算法
- 5.4.1 K均值算法
- 5.4.2 二分K均值聚類算法
- 5.4.3 小批量K均值算法
- 5.4.4 K均值++算法
- 5.4.5 K中心點算法
- 5.4.6 數(shù)據(jù)流K均值算法
- 5.5 基于密度的聚類算法
- 5.5.1 DBSCAN算法
- 5.5.2 OPTICS算法
- 5.6 基于模型的聚類算法:高斯混合模型算法
- 5.6.1 算法原理
- 5.6.2 GMM算法的參數(shù)估計
- 5.6.3 GMM算法實踐
- 5.7 層次聚類
- 5.7.1 凝聚的層次聚類算法
- 5.7.2 聚類之間距離的度量方法
- 5.7.3 層次聚類算法的性質(zhì)
- 5.7.4 BIRCH算法
- 5.8 基于網(wǎng)格的聚類算法
- 5.8.1 STING算法
- 5.8.2 CLIQUE算法
- 5.9 Mean Shift聚類算法
- 5.9.1 基本概念
- 5.9.2 Mean Shift算法聚類過程
- 5.9.3 Mean Shift聚類算法實踐
- 5.9.4 改進的Mean Shift算法
- 5.10 聚類算法評價指標
- 5.10.1 調(diào)整蘭德指數(shù)
- 5.10.2 互信息評分
- 5.10.3 同質(zhì)性、完整性以及調(diào)和平均
- 5.10.4 Fowlkes-Mallows評分
- 5.10.5 輪廓系數(shù)
- 5.10.6 Calinski-Harabz指數(shù)
- 習(xí)題
- 第6章 數(shù)據(jù)挖掘綜合應(yīng)用:異常檢測
- 6.1 預(yù)備知識
- 6.1.1 相關(guān)統(tǒng)計學(xué)概念
- 6.1.2 異常檢測評價指標
- 6.1.3 異常檢測問題的特點
- 6.1.4 異常檢測算法分類
- 6.2 基于隔離森林的異常檢測算法
- 6.2.1 隔離與隔離樹iTree
- 6.2.2 隔離森林的特點
- 6.2.3 隔離森林算法
- 6.2.4 應(yīng)用實例
- 6.3 局部異常因子算法
- 6.3.1 基本定義
- 6.3.2 異常檢測
- 6.3.3 應(yīng)用實例
- 6.4 基于One-Class SVM的異常檢測算法
- 6.4.1 基本原理
- 6.4.2 應(yīng)用實例
- 6.5 基于主成分分析的異常檢測算法
- 6.6 基于集成學(xué)習(xí)的異常檢測算法
- 6.6.1 基本原理
- 6.6.2 應(yīng)用實例
- 6.7 其他有監(jiān)督學(xué)習(xí)類型的檢測算法
- 6.7.1 罕見類別檢測
- 6.7.2 基于有監(jiān)督學(xué)習(xí)的異常檢測實例
- 6.7.3 異常檢測應(yīng)用實例——時空異常檢測
- 6.7.4 Spark異常值檢測實例
- 6.8 習(xí)題
- 附錄 《大數(shù)據(jù)分析與挖掘》配套實驗課程方案簡介
- 參考文獻
- 作者簡介 更新時間:2020-09-24 12:36:56