- Jupyter數據科學實戰
- (印)普拉泰克·古普塔
- 920字
- 2020-11-21 11:56:28
前言
如今,數據科學已經成為每個組織中不可或缺的一部分,并且雇主愿意支付高薪聘請這方面的專業技術人才。行業的需求快速變化,數據不斷增長和演變,從而增加了業內對數據科學家的需求。然而,一直困擾著每一家公司的問題是,是否有充足的高技能人才能夠進行分析?能夠獲得多少數據?數據從何而來?分析技術的進步如何為企業提供更深入的見解?通過閱讀本書,讀者一定能夠進一步了解上述情況。
在任何領域要成為專家,每個人都必須從一個切入點開始學習。在本書設計之初就考慮到了這一點,以便作為讀者在數據科學領域的起點。當我在這個領域開始職業生涯的時候,幾乎不能找到一本可以用來學習數據科學概念、練習案例并在面臨類似問題時復習。我很快意識到數據科學是一個非常廣闊的領域,把所有知識都放在一本篇幅較短的書里是不可能的。因此,我決定在這本書里傳授我的經驗,在這里讀者將獲得成為一名數據科學家所需的基本知識和技能,而不用浪費寶貴的時間去尋找分散在互聯網上的材料。
本書的各個章節前后照應,自然銜接。第1章介紹數據和各種現代數據科學技能。第2章介紹如何安裝并配置工具,以幫助讀者練習本書中討論的例子。第3章~第6章介紹Python中所有類型的數據結構,它們將用于日常數據科學工作。第7章介紹與數據庫交互的方法。第8章介紹數據分析中常用的統計概念。第9章介紹通過學習如何讀取、加載和理解Jupyter筆記本中用于分析的不同類型的數據,讀者開始了成為一名數據科學家的旅程。第10章和第11章指導讀者完成不同的數據清理和可視化技術。
從第12章開始,結合從前幾章中獲得的知識來對真實用例進行數據預處理。第13章和第14章介紹監督式和無監督式的機器學習問題以及如何解決它們。第15章和第16章涵蓋時間序列數據,并介紹如何處理這些數據。在關鍵概念介紹完畢之后,第17章~第20章中包括了4個不同的案例研究,在其中應用學習到的所有知識,并練習解決現實世界中的問題。
本書是我借助Python簡略地介紹數據科學基本原理的一本書,它節省了讀者花費在理論上的時間以便能夠專注于實際案例。這些練習案例包括真實的數據集和問題,使讀者有信心解決類似或相關的數據問題。我希望讀者充分利用這本書的價值,它使讀者能夠在很短的時間內擴展其作為一位實踐者的數據科學知識。