- 對比Excel,輕松學習Python數(shù)據(jù)分析(入職數(shù)據(jù)分析師系列)
- 張俊紅
- 707字
- 2019-07-25 11:41:38
序言
有幸收到張俊紅的做序邀請,我非常高興。
從PC時代到移動互聯(lián)網(wǎng)時代一路走來,每個人都感受到了數(shù)據(jù)爆炸性的增長,以及其中蘊含的巨大價值。
從PC時代開始,我們用鍵盤、掃描儀等設備使信息數(shù)據(jù)化。在移動互聯(lián)網(wǎng)時代,智能手機通過攝像頭、GPS、陀螺儀等各種傳感器將我們的位置、行動軌跡、行為偏好,甚至情緒等信息數(shù)據(jù)化。截至2000年,全人類存儲了大約12EB的數(shù)據(jù),要知道1PB=1024TB,而1EB=1024PB。但是到了2011年,一年所產(chǎn)生的數(shù)據(jù)就高達1.82ZB (注:1ZB=1024EB),數(shù)據(jù)已經(jīng)變成了一種人造的“新能源”。
在商業(yè)領域,從信息到商品,從商品到服務,越來越多我們熟悉的事物被標準的數(shù)據(jù)所度量。無論是在線廣告的精準營銷,還是電子商務的個性化推薦,又或者是互聯(lián)網(wǎng)金融的人臉識別,互聯(lián)網(wǎng)的每一次效率提升都依賴于對傳統(tǒng)信息、物品,甚至人的數(shù)據(jù)化。
在使用數(shù)據(jù)進行效率變革及商業(yè)化的道路上,Excel和Python扮演了關鍵的角色,它們幫助數(shù)據(jù)分析師高效地從海量數(shù)據(jù)中發(fā)現(xiàn)問題,驗證假設,搭建模型,預測未來。
作為一本數(shù)據(jù)分析的專業(yè)書籍,作者從數(shù)據(jù)采集、清洗、抽取,以及數(shù)據(jù)可視化等多個角度介紹了日常工作中數(shù)據(jù)分析的標準路徑。通過對比Excel與Python在數(shù)據(jù)處理過程中的操作步驟,詳細說明了Excel與Python間的差異,以及用Python進行數(shù)據(jù)分析的方法。
雖與作者素未謀面,但是對于Python在處理海量數(shù)據(jù)和建模上的高效性與便捷性,以及Python在機器學習中的重要性,我們的觀點是一致的。同時我們也相信對于數(shù)據(jù)分析從業(yè)者來說,掌握一種用于數(shù)據(jù)處理的編程語言是非常必要的,而從 Excel 到Python的學習方法則是一條學好數(shù)據(jù)分析的“捷徑”。
王彥平
(網(wǎng)名“藍鯨”,電子書《從Excel到Python——數(shù)據(jù)分析進階指南》《從Excel到R——數(shù)據(jù)分析進階指南》《從Excel到SQL——數(shù)據(jù)分析進階指南》的作者)
2019年1月8日
- 從0到1:數(shù)據(jù)分析師養(yǎng)成寶典
- SQL Server 2008數(shù)據(jù)庫應用技術(第二版)
- Architects of Intelligence
- Oracle RAC 11g實戰(zhàn)指南
- 云計算服務保障體系
- OracleDBA實戰(zhàn)攻略:運維管理、診斷優(yōu)化、高可用與最佳實踐
- 金融商業(yè)算法建模:基于Python和SAS
- 辦公應用與計算思維案例教程
- INSTANT Apple iBooks How-to
- Instant Autodesk AutoCAD 2014 Customization with .NET
- 智慧的云計算
- Unreal Engine Virtual Reality Quick Start Guide
- Filecoin原理與實現(xiàn)
- Oracle 11g數(shù)據(jù)庫管理員指南
- 數(shù)據(jù)挖掘算法實踐與案例詳解