舉報

會員
深入淺出數(shù)據(jù)科學(xué):Python編程
最新章節(jié):
11.4 本章小結(jié)
本書通過對數(shù)據(jù)科學(xué)技術(shù)基本技能和豐富實用的示例的介紹,展示如何獲取、分析和可視化數(shù)據(jù),利用數(shù)據(jù)應(yīng)對常見的業(yè)務(wù)挑戰(zhàn)。通過優(yōu)化共享單車公司的業(yè)務(wù)運營、從網(wǎng)站上提取數(shù)據(jù)并創(chuàng)建推薦系統(tǒng)等示例,你將學(xué)會如何找到數(shù)據(jù)驅(qū)動的解決方案并使用這些方案做出商業(yè)決策。本書所涵蓋的內(nèi)容包括進行探索性數(shù)據(jù)分析、運行A/B測試、使用邏輯回歸模型進行二分類及使用機器學(xué)習(xí)算法等。通過本書,你還將學(xué)習(xí)如何預(yù)測客戶需求、優(yōu)化營銷活動、減少客戶流失、預(yù)測網(wǎng)站流量,以及構(gòu)建推薦系統(tǒng)等。
目錄(184章)
倒序
- 封面
- 版權(quán)信息
- 版權(quán)
- 版權(quán)聲明
- 內(nèi)容提要
- 作者簡介
- 技術(shù)評審簡介
- 致謝
- 前言
- 本書的目標(biāo)讀者
- 有志成為數(shù)據(jù)科學(xué)家的人
- 專業(yè)人士
- 數(shù)據(jù)科學(xué)愛好者
- 學(xué)生
- 本書內(nèi)容介紹
- 設(shè)置環(huán)境
- Windows
- macOS
- Linux
- 安裝Python庫
- 其他工具
- 總結(jié)
- 資源與支持
- 資源獲取
- 提交錯誤信息
- 與我們聯(lián)系
- 關(guān)于異步社區(qū)和異步圖書
- 1 探索性數(shù)據(jù)分析
- 1.1 作為CEO的第一天
- 1.1.1 找出數(shù)據(jù)中的規(guī)律
- 1.1.2 使用.csv文件查看和存儲數(shù)據(jù)
- 1.2 用Python顯示數(shù)據(jù)
- 1.3 計算匯總統(tǒng)計信息
- 1.4 分析數(shù)據(jù)子集
- 1.4.1 夜間數(shù)據(jù)
- 1.4.2 季節(jié)性數(shù)據(jù)
- 1.5 使用Matplotlib進行數(shù)據(jù)可視化
- 1.5.1 繪制并顯示一個簡單的圖表
- 1.5.2 為圖表添加標(biāo)題和標(biāo)簽
- 1.5.3 繪制數(shù)據(jù)子集圖表
- 1.5.4 測試不同繪圖類型
- 1.6 探索相關(guān)性
- 1.6.1 計算相關(guān)系數(shù)
- 1.6.2 理解強相關(guān)性和弱相關(guān)性
- 1.6.3 尋找變量之間的相關(guān)性
- 1.7 創(chuàng)建熱力圖
- 1.8 進一步探索
- 1.9 本章小結(jié)
- 2 預(yù)測
- 2.1 預(yù)測客戶需求
- 2.2 清洗錯誤數(shù)據(jù)
- 2.3 使用數(shù)據(jù)繪圖從而發(fā)現(xiàn)趨勢
- 2.4 執(zhí)行線性回歸
- 2.4.1 將代數(shù)應(yīng)用于回歸線
- 2.4.2 計算誤差測量
- 2.5 使用回歸預(yù)測未來趨勢
- 2.6 嘗試更多的回歸模型
- 2.6.1 通過多變量線性回歸對銷售量進行預(yù)測
- 2.6.2 用三角函數(shù)捕捉變化
- 2.7 選擇用于預(yù)測的最佳回歸模型
- 2.8 進一步探索
- 2.9 本章小結(jié)
- 3 分組比較
- 3.1 讀取總體數(shù)據(jù)
- 3.1.1 匯總統(tǒng)計信息
- 3.1.2 隨機采樣
- 3.1.3 樣本數(shù)據(jù)之間的差異
- 3.2 進行假設(shè)檢驗
- 3.2.1 t檢驗
- 3.2.2 假設(shè)檢驗的細微差別
- 3.3 在實際環(huán)境中進行組間比較
- 3.4 本章小結(jié)
- 4 A/B測試
- 4.1 實驗的必要性
- 4.2 運行實驗來檢驗新的假設(shè)
- 4.2.1 理解A/B測試的數(shù)學(xué)原理
- 4.2.2 將數(shù)學(xué)轉(zhuǎn)化為實踐
- 4.3 優(yōu)化冠軍/挑戰(zhàn)者框架
- 4.4 用泰曼定律和A/A測試預(yù)防錯誤
- 4.5 理解效應(yīng)值
- 4.6 計算數(shù)據(jù)的顯著性
- 4.7 應(yīng)用及注意事項
- 4.8 A/B測試的倫理問題
- 4.9 本章小結(jié)
- 5 二分類算法
- 5.1 減少客戶流失
- 5.2 利用線性概率模型發(fā)現(xiàn)高流失風(fēng)險客戶
- 5.2.1 繪制流失情況數(shù)據(jù)圖表
- 5.2.2 用線性回歸確定關(guān)系
- 5.2.3 預(yù)測未來
- 5.2.4 提出業(yè)務(wù)建議
- 5.2.5 測量預(yù)測準(zhǔn)確性
- 5.2.6 使用多變量線性概率模型
- 5.2.7 創(chuàng)建新指標(biāo)
- 5.2.8 線性概率模型的缺點
- 5.3 用邏輯回歸預(yù)測二分類結(jié)果
- 5.3.1 繪制邏輯曲線
- 5.3.2 邏輯回歸
- 5.4 二分類的應(yīng)用
- 5.5 本章小結(jié)
- 6 監(jiān)督學(xué)習(xí)
- 6.1 預(yù)測網(wǎng)站流量
- 6.2 讀取并繪制文章數(shù)據(jù)
- 6.3 使用線性回歸作為預(yù)測方法
- 6.4 理解監(jiān)督學(xué)習(xí)
- 6.5 k近鄰
- 6.5.1 使用kNN
- 6.5.2 使用Python的sklearn執(zhí)行kNN
- 6.6 使用其他監(jiān)督學(xué)習(xí)算法
- 6.6.1 決策樹
- 6.6.2 隨機森林
- 6.6.3 神經(jīng)網(wǎng)絡(luò)
- 6.7 測量預(yù)測準(zhǔn)確性的指標(biāo)
- 6.8 使用多變量模型
- 6.9 使用分類代替回歸
- 6.10 本章小結(jié)
- 7 無監(jiān)督學(xué)習(xí)
- 7.1 無監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)
- 7.2 生成和探索數(shù)據(jù)
- 7.2.1 擲色子
- 7.2.2 使用另一種色子
- 7.3 聚類觀測的來源
- 7.4 實際業(yè)務(wù)中的聚類
- 7.5 分析多維數(shù)據(jù)
- 7.6 EM聚類
- 7.6.1 “猜測”步驟
- 7.6.2 “期望”步驟
- 7.6.3 “最大化”步驟
- 7.6.4 “收斂”步驟
- 7.7 其他聚類方法
- 7.8 其他無監(jiān)督學(xué)習(xí)方法
- 7.9 本章小結(jié)
- 8 網(wǎng)絡(luò)爬取
- 8.1 理解網(wǎng)站是如何運行的
- 8.2 創(chuàng)建第一個網(wǎng)頁爬蟲
- 8.3 解析HTML代碼
- 8.3.1 爬取電子郵件地址
- 8.3.2 直接搜索地址
- 8.4 使用正則表達式執(zhí)行搜索
- 8.4.1 使用元字符進行靈活的搜索
- 8.4.2 使用轉(zhuǎn)義序列對搜索進行微調(diào)
- 8.4.3 結(jié)合文本和元字符進行高級搜索
- 8.5 使用正則表達式搜索電子郵件地址
- 8.6 將爬取的結(jié)果轉(zhuǎn)換為可用數(shù)據(jù)
- 8.7 使用Beautiful Soup
- 8.7.1 解析HTML標(biāo)簽元素
- 8.7.2 爬取和解析HTML表格
- 8.9 本章小結(jié)
- 9 推薦系統(tǒng)
- 9.1 基于人氣的推薦
- 9.2 基于商品的協(xié)同過濾
- 9.2.1 量化向量相似性
- 9.2.2 計算余弦相似度
- 9.2.3 實現(xiàn)基于商品的協(xié)同過濾
- 9.3 基于用戶的協(xié)同過濾
- 9.4 案例研究:音樂推薦
- 9.5 用高級系統(tǒng)生成推薦
- 9.6 本章小結(jié)
- 10 自然語言處理
- 10.1 使用NLP技術(shù)檢測抄襲
- 10.2 理解word2vec NLP模型
- 10.2.1 量化單詞之間的相似性
- 10.2.2 創(chuàng)建一個方程組
- 10.3 word2vec中的數(shù)值向量分析
- 10.3.1 通過數(shù)學(xué)運算來操作向量
- 10.3.2 使用word2vec檢測抄襲
- 10.4 使用skip-thoughts
- 10.5 主題建模
- 10.6 其他NLP應(yīng)用
- 10.7 本章小結(jié)
- 11 其他語言中的數(shù)據(jù)科學(xué)
- 11.1 用SQL贏得足球比賽
- 11.1.1 讀取和分析數(shù)據(jù)
- 11.1.2 熟悉SQL
- 11.1.3 設(shè)置SQL數(shù)據(jù)庫
- 11.1.4 運行SQL查詢
- 11.1.5 使用連接從多張表取得數(shù)據(jù)
- 11.2 用R贏得足球比賽
- 11.2.1 熟悉R
- 11.2.2 在R中使用線性回歸
- 11.2.3 使用R對數(shù)據(jù)進行繪圖
- 11.3 獲得其他有價值的技能
- 11.4 本章小結(jié) 更新時間:2025-08-07 17:49:58
推薦閱讀
- Data Visualization with D3 4.x Cookbook(Second Edition)
- CentOS 7 Linux Server Cookbook(Second Edition)
- 云計算通俗講義(第3版)
- Windows Server 2016 Automation with PowerShell Cookbook(Second Edition)
- Getting Started with Greenplum for Big Data Analytics
- Mastering ROS for Robotics Programming
- Web前端應(yīng)用開發(fā)技術(shù)
- 打開Go語言之門:入門、實戰(zhàn)與進階
- Python Essentials
- Building Slack Bots
- Penetration Testing with the Bash shell
- 現(xiàn)代CPU性能分析與優(yōu)化
- SQL Server 2012 數(shù)據(jù)庫應(yīng)用教程(第3版)
- Java 11 and 12:New Features
- 優(yōu)化驅(qū)動的設(shè)計方法
- Mastering Machine Learning with scikit-learn
- Internet of Things with Arduino Cookbook
- Neo4j Graph Data Modeling
- 機器人ROS開發(fā)實踐
- 信息安全技術(shù)(第2版)
- HTML 5+CSS 3+jQuery Mobile移動網(wǎng)站與APP開發(fā)實戰(zhàn)
- Learning ArcGIS Geodatabases
- 移山之道:VSTS軟件開發(fā)指南
- 商業(yè)銀行經(jīng)營管理(第2版)
- Python 3.6零基礎(chǔ)入門與實戰(zhàn)
- JavaScript for .NET Developers
- Machine Learning Algorithms
- 網(wǎng)頁制作教程
- Python工匠:案例、技巧與工程實踐
- Implementing Samba 4