舉報

會員
大數據分析處理(慕課版)
最新章節:
項目實踐
本書采用理論知識與任務案例相結合的形式,以PyCharm為主要開發工具,系統地闡述了大數據分析處理工作流程中的重要步驟,介紹了大數據分析過程中常用的幾種第三方庫。本書共13個單元,第1單元介紹了大數據分析處理的概念;第2、3單元介紹了大數據分析中科學計算與統計分析的相關知識;第4-7單元介紹了使用Pandas實現數據預處理的方法;第8單元介紹了使用Scikit-learn實現簡單的機器學習的方法;第9單元介紹了使用Matplotlib、Seaborn繪制圖表的方法;第10-13單元分別介紹了4個大數據分析處理的綜合案例。單元1-9中,每個單元都包含了相關知識部分和任務實現部分,任務實現部分一般包含多個任務的具體實現過程,每個任務后面都有課堂實踐,通過完成實踐操作,讀者可以進一步鞏固所學知識。本書既可作為高等院校大數據技術專業的教材,也可作為大數據愛好者的自學書籍。
目錄(218章)
倒序
- 封面
- 版權信息
- 內容提要
- 前言
- 單元1 大數據分析概述
- 學習目標
- 相關知識
- 1.大數據分析的概念
- 2.大數據分析的發展過程
- 3.大數據分析的應用場景
- 4.大數據分析流程
- 5.傳統的統計分析軟件
- 6.大數據分析編程語言
- 7.大數據可視化分析工具
- 任務實現
- 任務1.1 根據業務需求選擇合適的大數據分析技術
- 任務1.2 使用pip和PyCharm完成Python庫的管理
- 素養拓展
- 單元小結
- 課后習題
- 單元2 numpy科學計算基礎
- 學習目標
- 相關知識
- 1.numpy與ndarray對象
- 2.創建ndarray數組的函數
- 3.numpy支持的數據類型
- 4.數組的矢量化運算
- 5.廣播機制
- 6.數組與標量的算術運算
- 7.numpy通用函數
- 8.numpy數組的統計與排序方法
- 9.numpy的numpy.linalg模塊
- 任務實現
- 任務2.1 保存考試成績——創建一個數組
- 任務2.2 查看考試成績數據類型——查看數組元素的數據類型
- 任務2.3 對兩門課成績進行相加——實現數組運算
- 任務2.4 對考試成績進行計算——使用numpy通用函數實現數組計算
- 任務2.5 對考試成績進行統計與排序——利用numpy數組進行數據處理
- 任務2.6 對多門課成績進行計算——使用numpy的線性代數模塊處理矩陣
- 素養拓展
- 單元小結
- 課后習題
- 單元3 pandas統計分析基礎
- 學習目標
- 相關知識
- 1.pandas與pandas的數據結構
- 2.創建Series和DataFrame的函數
- 3.索引與切片
- 4.排序算法與實現排序的方法
- 5.統計學與統計方法
- 任務實現
- 任務3.1 用不同方式創建Series對象
- 任務3.2 用不同方式創建DataFrame
- 任務3.3 訪問和提取隨機數據——使用DataFrame進行索引與切片
- 任務3.4 對學生數據進行排序——實現數據排序
- 任務3.5 進行隨機數據統計——實現數據統計
- 素養拓展
- 單元小結
- 課后習題
- 單元4 數據讀取與寫入
- 學習目標
- 相關知識
- 1.常用的數據文件類型
- 2.文本文件讀取與寫入
- 3.Excel文件讀取與寫入
- 4.數據庫文件讀取與寫入
- 任務實現
- 任務4.1 讀取并存儲城市經緯度數據——TXT文件讀寫
- 任務4.2 讀取并存儲招聘數據——CSV文件的讀寫
- 任務4.3 讀取并存儲用戶數據——Excel文件的讀寫
- 任務4.4 讀取商品類別數據并存儲賬戶數據——MySQL讀寫
- 素養拓展
- 單元小結
- 課后習題
- 單元5 數據質量與數據清洗
- 學習目標
- 相關知識
- 1.企業數據管理現狀
- 2.數據標準
- 3.數據質量的定義
- 4.常用的數據質量檢測手段
- 5.數據質量管理的必要性
- 6.缺失值
- 7.重復值
- 8.異常值
- 任務實現
- 任務5.1 醫藥銷售數據遺漏檢查——缺失值處理
- 任務5.2 醫藥銷售數據去重校驗——重復值處理
- 任務5.3 醫藥銷售數據異常值排除——異常值處理
- 素養拓展
- 單元小結
- 課后習題
- 單元6 數據合并與數據轉換
- 學習目標
- 相關知識
- 1.concat函數
- 2.append方法
- 3.merge函數
- 4.join方法
- 5.combine_first方法
- 6.map方法
- 7.cut函數
- 8.qcut函數
- 任務實現
- 任務6.1 堆疊學生信息和考試成績數據——實現數據堆疊
- 任務6.2 連接學生信息和考試成績數據——實現數據連接
- 任務6.3 對學生考試成績進行等級轉換——實現數據映射轉換
- 任務6.4 對學生考試成績進行離散化——實現數據離散化
- 素養拓展
- 單元小結
- 課后習題
- 單元7 數據分組與數據聚合
- 學習目標
- 相關知識
- 1.數據分組的概念
- 2.groupby方法
- 3.數據分組的原則和依據
- 4.數據分組的方法
- 5.數據聚合的概念
- 6.agg方法和aggregate方法
- 7.apply方法
- 8.transform方法
- 任務實現
- 任務7.1 簡單數據表處理——數據分組
- 任務7.2 人員得分表處理——數據聚合
- 素養拓展
- 單元小結
- 課后習題
- 單元8 scikit-learn機器學習
- 學習目標
- 相關知識
- 1.機器學習的概念
- 2.機器學習的分類
- 3.假設空間
- 4.歸納偏好
- 5.sklearn
- 6.劃分數據集函數
- 7.preprocessing模塊
- 8.標準化和歸一化
- 9.降維
- 10.線性回歸模型
- 11.邏輯斯諦回歸模型
- 12.K-means算法
- 13.樸素貝葉斯分類
- 14.支持向量機算法
- 任務實現
- 任務8.1 使用sklearn處理iris數據集——使用sklearn處理數據
- 任務8.2 boston數據集預處理和降維——數據預處理
- 任務8.3 使用boston數據集構建回歸模型——回歸模型分析與預測
- 任務8.4 使用iris數據集構建分類模型——分類模型分析與預測
- 任務8.5 使用iris數據集構建聚類模型——聚類模型分析與評價
- 素養拓展
- 單元小結
- 課后習題
- 單元9 使用統計圖表展示數據
- 學習目標
- 相關知識
- 1.數據可視化的概念
- 2.數據可視化的設計過程
- 3.基本圖表類型及使用場景
- 4.pyplot基礎語法
- 5.rc參數
- 6.繪制線圖的函數plot
- 7.繪制柱狀圖的函數bar
- 8.繪制直方圖的函數hist
- 9.繪制餅圖的函數pie
- 10.繪制散點圖的函數scatter
- 11.子圖的概念
- 12.seaborn
- 任務實現
- 任務9.1 使用線圖展示水果銷量變化曲線——掌握matplotlib基礎語法
- 任務9.2 使用常用圖表展示各品牌汽車銷售額——繪制常見圖表
- 任務9.3 使用子圖展示就業率數據——創建子圖
- 任務9.4 使用seaborn展示汽車數據的分布與相關性——使用seaborn繪制圖表
- 素養拓展
- 單元小結
- 課后習題
- 單元10 某地區電力公司用戶付費行為預測
- 項目目標
- 相關背景知識
- 任務實現
- 任務10.1 數據采集和數據描述
- 任務10.2 電力數據預處理
- 任務10.3 模型建立與評估
- 項目總結
- 項目實踐
- 單元11 《你好,舊時光》文本挖掘分析
- 項目目標
- 相關背景知識
- 任務實現
- 任務11.1 項目準備
- 任務11.2 文本數據準備與處理
- 任務11.3 文本分詞與詞云圖繪制
- 任務11.4 關系網絡探索
- 任務11.5 聚類分析
- 項目總結
- 項目實踐
- 單元12 基于大數據可視化的城市通勤特征分析研究
- 項目目標
- 相關背景知識
- 任務實現
- 任務12.1 原始數據預處理
- 任務12.2 詞云圖的繪制
- 任務12.3 繪制起止點分布連線圖
- 任務12.4 繪制早高峰地鐵刷卡進出站分布圖
- 任務12.5 職住地識別與分析
- 項目總結
- 項目實踐
- 單元13 上市公司新聞情感與股票價格的關系
- 項目目標
- 相關背景知識
- 任務實現
- 任務13.1 網絡數據爬取
- 任務13.2 中文文本處理
- 任務13.3 使用機器學習算法進行情感分析
- 任務13.4 繪制詞云圖
- 項目總結
- 項目實踐 更新時間:2024-04-23 17:44:15
推薦閱讀
- 2020年山東公務員錄用考試專項題庫:資料分析【歷年真題+章節題庫+模擬試題】
- 會展策劃與管理
- 積極心理教育概論
- 希爾《國際商務》(第11版)課后習題詳解
- 電子商務與物流管理
- 涂料分析與檢測
- 數據處理與管理(Excel、Access及文獻檢索)
- Premiere Pro CC視頻剪輯基礎教程(移動學習版)
- 經濟法基礎
- 大學一年級英文教本
- 交通工程專業實驗教程
- 物理化學實驗(第二版)
- 剪映:短視頻剪輯與運營全能一本通(微課版)
- Python深度學習及智能車競賽實踐
- 皮細庚《日語概說》筆記和課后習題詳解
- 無機及分析化學實驗(第二版)
- HyperMesh實用工程技術
- 思則有備:新時代安全教育通論(大學生版)
- 中國電影百年(1977-2005)
- 光電控制系統技術與應用
- 自然辯證法概論 專題講義
- 首都經濟貿易大學勞動經濟學院703統計學原理歷年考研真題及詳解
- 應用電化學基礎
- 美在東華:2013藝術類作品精選
- 天津外國語大學俄語語言文學802(俄語語言文學)歷年考研真題及詳解
- 基礎會計(第4版)
- 財務預算與控制(第二版)
- 信息檢索與利用
- 中國人民大學統計學院432統計學[專業碩士]歷年考研真題(含復試)匯編
- 服裝色彩學(第6版)