- Python數據科學實戰
- (俄)尤利·瓦西列夫
- 1816字
- 2024-01-31 18:22:36
前言
我們生活在一個信息技術(Information Technology,IT)無處不在的世界中,計算機系統收集、處理大量數據,并從中提取有用信息。這種數據驅動的現實不僅影響現代企業的運營方式,還影響我們的日常生活。如果沒有大量使用以數據為中心的設備和系統,許多人將很難與社會保持聯系。
在商業領域,公司經常使用IT系統從大量數據中提取可操作的信息來做出決策。數據可能有不同的來源,以不同的格式保存,可能需要經過轉換才能進行分析。例如,許多從事在線業務的公司使用數據分析來實現客戶的獲取和保留,收集、測量可以模擬和了解用戶行為的一切信息。他們經常結合并分析許多不同來源的定量和定性用戶數據,如用戶檔案、社交媒體和公司網站。在許多情況下,他們使用Python語言完成這些任務。
本書將介紹如何在面向數據的應用程序中使用Python,如何生成產品推薦,如何預測股市趨勢等。通過真實示例,你將獲得使用Python第三方庫的實踐經驗。
在數據科學中使用Python
Python語言是訪問、操作任何類型數據并挖掘信息的理想選擇。Python既有一組豐富的內置數據結構,又有一個強大的開源庫生態系統。本書將探討許多這樣的庫,包括NumPy、pandas、scikit-learn、Matplotlib等。
你可以使用Python輕松編寫簡潔的代碼,用幾行代碼表達大多數概念。事實上,Python靈活的語法允許你用一行代碼實現多個數據操作。例如,你可以用一行代碼過濾、轉換和聚合數據。
作為一種通用語言,Python適用于各種任務。在使用Python時,你可以將數據科學與其他任務無縫集成,以創建功能全面的應用程序。例如,你可以構建一個bot應用程序,根據用戶的自然語言請求進行股市預測。要創建這樣的應用程序,你需要一個bot API、一個機器學習預測模型和一個與用戶交互的自然語言處理(Natural Language Processing,NLP)工具。所有這些都可以借助Python第三方庫實現。
本書讀者對象
本書面向希望更好地理解Python數據處理和分析功能的開發人員。也許你為一家希望使用數據改進業務流程、做出合理決策并面向更多客戶的公司工作。或者,你可能想開發自己的數據驅動應用程序,或者簡單地將Python知識擴展到數據科學領域。
本書假設你有一些使用Python的基本經驗,并且能夠按照相關說明輕松地安裝數據庫或獲取API密鑰等。本書涵蓋Python數據科學方面的概念,并通過示例對其進行解釋。你將在實踐中學習,不需要有數據分析方面的經驗。
本書內容
本書首先介紹數據處理和分析的概念,解釋典型的數據處理流程;然后介紹Python的內置數據結構和一些廣泛用于數據科學應用程序的Python第三方庫。接下來,本書探索越來越復雜的技術,用于獲取、合并、聚合、分析和可視化不同大小、不同類型的數據集。我們將進一步把Python數據科學技術應用到商業管理、營銷和金融領域的實際示例中。
以下是每章內容的概述。
第1章講述數據的類別、數據來源和數據處理流程等。
第2章介紹Python內置的4種數據結構——列表、元組、字典和集合。
第3章討論用于數據分析和操作的Python第三方庫。你將學習pandas庫及其主要數據結構、序列和數據框,它們已成為面向數據的Python應用程序的標準。你還將了解兩個常用數據科學庫——NumPy和scikit-learn。
第4章深入剖析如何獲取數據并將其加載到腳本中。你將學習如何把不同來源的數據(如文件和API)加載到Python腳本的數據結構中,以進行進一步處理。
第5章繼續討論如何將數據導入Python,包括如何使用數據庫中的數據。你將看到訪問和操作存儲在不同類型數據庫中的數據的示例,這些數據庫包括關系數據庫(如MySQL)和非關系數據庫(如MongoDB)。
第6章介紹如何對數據分組并解決數據匯總的問題。你將學習使用pandas對數據進行分組,并生成小計、總計和其他聚合數據。
第7章介紹如何將不同來源的數據合并到單個數據集中。你將學習SQL開發人員用于連接數據庫表的技術,并將其應用于多種數據結構。
第8章討論可視化,這是揭示數據隱藏模式的自然方式之一。你將了解不同類型的可視化形式,如折線圖、柱狀圖和直方圖,并學習如何使用Matplotlib庫創建它們,Matplotlib庫是用于繪圖的主要Python庫。
第9章解釋如何使用geopy庫和Shapely庫處理位置數據。你將學習如何獲取和使用靜止與移動物體的GPS坐標,并將了解共享服務如何為給定的上車位置找到最佳出租車。
第10章介紹一些用于從時間序列數據中提取統計信息的分析技術。該章的示例說明了如何將時間序列數據分析應用于股市數據。
第11章探討從數據中挖掘信息的策略,以便做出明智的決策。例如,你將學習如何發現超市銷售的產品之間的關聯,以便確定客戶在單筆交易中經常一起購買的商品(這對推薦和促銷有用)。
第12章介紹如何用scikit-learn庫處理高級數據分析任務。你將訓練機器學習模型,根據產品評價的評分對其進行分類,并預測股票價格的趨勢。
- Mastering Ext JS(Second Edition)
- 移動UI設計(微課版)
- C#編程入門指南(上下冊)
- 算法精粹:經典計算機科學問題的Python實現
- Raspberry Pi 2 Server Essentials
- 軟件工程
- Learning Probabilistic Graphical Models in R
- 低代碼平臺開發實踐:基于React
- Python自然語言理解:自然語言理解系統開發與應用實戰
- 軟件測試技術
- FusionCharts Beginner’s Guide:The Official Guide for FusionCharts Suite
- Python無監督學習
- 用Go語言自制編譯器
- 少年小魚的魔法之旅:神奇的Python
- 深度學習的數學:使用Python語言