官术网_书友最值得收藏!

前言

為什么要寫這本書

本書既是一本數據分析的書,也是一本Excel數據分析的書,同時還是一本Python數據分析的書。在互聯網上,無論是搜索數據分析,還是搜索Excel數據分析,亦或是搜索Python數據分析,我們都可以找到很多相關的圖書。既然已經有這么多同類題材的書了,為什么我還要寫呢?因為在我準備寫這本書時,還沒有一本把數據分析、Excel數據分析、Python數據分析這三者結合在一起的書。

為什么我要把它們結合在一起寫呢?那是因為,我認為這三者是一個數據分析師必備的技能,而且這三者本身也是一個有機統一體。數據分析讓你知道怎么分析以及分析什么;Excel和Python是你在分析過程中會用到的兩個工具。

為什么要學習Python

既然Python在數據分析領域是一個和Excel類似的數據分析工具,二者實現的功能都一樣,為什么還要學Python,把Excel學好不就行了嗎?我認為學習Python的主要原因有以下幾點。

1.在處理大量數據時,Python的效率高于Excel

當數據量很小的時候,Excel和Python的處理速度基本上差不多,但是當數據量較大或者公式嵌套太多時,Excel 就會變得很慢,這個時候怎么辦呢?我們可以使用Python,Python 對于海量數據的處理效果要明顯優于 Excel。用Vlookup 函數做一個實驗,兩個大小均為23MB的表(6萬行數據),在未作任何處理、沒有任何公式嵌套之前,Excel中直接在一個表中用Vlookup函數獲取另一個表的數據需要20秒(我的計算機性能參數是I7、8GB內存、256GB固態硬盤),配置稍微差點的計算機可能打開這個表都很難。但是用Python實現上述過程只需要580毫秒,即0.58秒,是Excel效率的34倍。

2.Python可以輕松實現自動化

你可能會說Excel的VBA也可以自動化,但是VBA主要還是基于Excel內部的自動化,一些其他方面的自動化 VBA 就做不了,比如你要針對本地某一文件夾下面的文件名進行批量修改,VBA就不能實現,但是Python可以。

3.Python可用來做算法模型

雖然你是做數據分析的,但是一些基礎的算法模型還是有必要掌握的,Python可以讓你在懂一些基礎的算法原理的情況下就能搭建一些模型,比如你可以使用聚類算法搭建一個模型去對用戶進行分類。

為什么要對比Excel學習Python

Python雖然是一門編程語言,但是在數據分析領域實現的功能和Excel的基本功能一樣,而Excel又是大家比較熟悉、容易上手的軟件,所以可以通過Excel數據分析去對比學習Python數據分析。對于同一個功能,本書告訴你在Excel中怎么做,并告訴你對應到Python中是什么樣的代碼。例如數值替換,即把一個值替換成另一個值,對把“Excel”替換成“Python”這一要求,在Excel中可以通過鼠標點選實現,如下圖所示。

在Python中則通過具體的代碼實現,如下所示。

本書將數據分析過程中涉及的每一個操作都按這種方式對照講解,讓你從熟悉的Excel操作中去學習對應的Python實現,而不是直接學習Python代碼,大大降低了學習門檻,消除了大家對代碼的恐懼心理。這也是本書的一大特色,也是我為什么要寫本書的最主要原因,就是希望幫助你不再懼怕代碼,讓你可以像學Excel數據分析一樣,輕松學習Python數據分析。

本書的學習建議

要想完全掌握一項技能,你必須系統學習它,知道它的前因后果。本書不是孤立地講Excel或者Python中的操作,而是圍繞整個數據分析的常規流程:熟悉工具—明確目的—獲取數據—熟悉數據—處理數據—分析數據—得出結論—驗證結論—展示結論,告訴你每一個過程都會用到什么操作,這些操作用Excel和Python分別怎么實現。這樣一本書既是系統學習數據分析流程操作的說明書,也是數據分析師案頭必備的實操工具書。

大家在讀第一遍的時候不用記住所有函數,你是記不住的,即使你記住了,如果在工作中不用,那么很快就會忘記。正確的學習方式應該是,先弄清楚一名數據分析師在日常工作中對工具都會有什么需求(當然了,本書的順序是按照數據分析的常規分析流程來寫的),希望工具幫助你達到什么樣的目的,羅列好需求以后,再去研究工具的使用方法。比如,要刪除重復值,就要明確用Excel如何實現,用Python又該如何實現,兩種工具在實現方式上有什么異同,這樣對比次數多了以后,在遇到問題時,你自然而然就能用最快的速度選出最適合的工具了。

數據分析一定是先有想法然后考慮如何用工具實現,而不是剛開始就陷入記憶工具的使用方法中。

本書寫了什么

本書分為三篇。

入門篇:主要講數據分析的一些基礎知識,介紹數據分析是什么,為什么要做數據分析,數據分析究竟在分析什么,以及數據分析的常規流程。

實踐篇:圍繞數據分析的整個流程,分別介紹每一個步驟中的操作,這些操作用Excel如何實現,用Python又如何實現。本篇內容主要包括:Python環境配置、Python基礎知識、數據源的獲取、數據概覽、數據預處理、數值操作、數據運算、時間序列、數據分組、數據透視表、結果文件導出、數據可視化等。

進階篇:介紹幾個實戰案例,讓你體會一下在實際業務中如何使用Python。具體來說,進階篇的內容主要包括,利用Python實現報表自動化、自動發送電子郵件,以及在不同業務場景中的案例分析。此外,還補充介紹了NumPy數組的一些常用方法。

本書適合誰

本書主要適合以下人群。

● Excel已經用得熟練,想學習Python來豐富自己技能的數據分析師。

● 剛入行對Excel和Python都不精通的數據分析師。

● 其他常用Excel卻想通過學習Python提高工作效率的人。

Python 雖然是一門編程語言,但是它并不難學,不僅不難學,而且很容易上手,這也是Python深受廣大數據從業者喜愛的原因之一,因此大家在學習Python之前首先在心里告訴自己一句話,那就是Python并沒有那么難。

致謝

感謝我的父母,是他們給了我受教育的機會,才有了今天的我。

感謝我的公眾號的讀者朋友們,如果不是他們,那么我可能不會堅持撰寫技術文章,更不會有這本書。

感謝慧敏讓我意識到寫書的意義,從而創作本書,感謝電子工業出版社為這本書忙碌的所有人。

感謝我的女朋友,在寫書的這段日子里,我幾乎把所有的業余時間全用在了寫作上,很少陪她,但她還是一直鼓勵我,支持我。

讀者服務

輕松注冊成為博文視點社區用戶(www.broadview.com.cn),掃碼直達本書頁面。

提交勘誤:您對書中內容的修改意見可在 提交勘誤 處提交,若被采納,將獲贈博文視點社區積分(在您購買電子書時,積分可用來抵扣相應金額)。

交流互動:在頁面下方 讀者評論 處留下您的疑問或觀點,與我們和其他讀者一同學習交流。

頁面入口:http://www.broadview.com.cn/35793

主站蜘蛛池模板: 平山县| 南皮县| 揭西县| 平凉市| 临沧市| 朝阳县| 北安市| 临潭县| 泸州市| 阿拉善盟| 吉木乃县| 威宁| 新乡县| 田阳县| 长宁县| 门头沟区| 祁门县| 临桂县| 买车| 松阳县| 镶黄旗| 迁安市| 林甸县| 茶陵县| 凤庆县| 略阳县| 新密市| 信宜市| 信阳市| 德昌县| 三都| 荃湾区| 丁青县| 富源县| 镇康县| 应用必备| 阜城县| 民丰县| 华坪县| 淮滨县| 全南县|