官术网_书友最值得收藏!

序言

有幸收到張俊紅的做序邀請,我非常高興。

從PC時代到移動互聯(lián)網(wǎng)時代一路走來,每個人都感受到了數(shù)據(jù)爆炸性的增長,以及其中蘊含的巨大價值。

從PC時代開始,我們用鍵盤、掃描儀等設備使信息數(shù)據(jù)化。在移動互聯(lián)網(wǎng)時代,智能手機通過攝像頭、GPS、陀螺儀等各種傳感器將我們的位置、行動軌跡、行為偏好,甚至情緒等信息數(shù)據(jù)化。截至2000年,全人類存儲了大約12EB的數(shù)據(jù),要知道1PB=1024TB,而1EB=1024PB。但是到了2011年,一年所產(chǎn)生的數(shù)據(jù)就高達1.82ZB (注:1ZB=1024EB),數(shù)據(jù)已經(jīng)變成了一種人造的“新能源”。

在商業(yè)領域,從信息到商品,從商品到服務,越來越多我們熟悉的事物被標準的數(shù)據(jù)所度量。無論是在線廣告的精準營銷,還是電子商務的個性化推薦,又或者是互聯(lián)網(wǎng)金融的人臉識別,互聯(lián)網(wǎng)的每一次效率提升都依賴于對傳統(tǒng)信息、物品,甚至人的數(shù)據(jù)化。

在使用數(shù)據(jù)進行效率變革及商業(yè)化的道路上,Excel和Python扮演了關鍵的角色,它們幫助數(shù)據(jù)分析師高效地從海量數(shù)據(jù)中發(fā)現(xiàn)問題,驗證假設,搭建模型,預測未來。

作為一本數(shù)據(jù)分析的專業(yè)書籍,作者從數(shù)據(jù)采集、清洗、抽取,以及數(shù)據(jù)可視化等多個角度介紹了日常工作中數(shù)據(jù)分析的標準路徑。通過對比Excel與Python在數(shù)據(jù)處理過程中的操作步驟,詳細說明了Excel與Python間的差異,以及用Python進行數(shù)據(jù)分析的方法。

雖與作者素未謀面,但是對于Python在處理海量數(shù)據(jù)和建模上的高效性與便捷性,以及Python在機器學習中的重要性,我們的觀點是一致的。同時我們也相信對于數(shù)據(jù)分析從業(yè)者來說,掌握一種用于數(shù)據(jù)處理的編程語言是非常必要的,而從 Excel 到Python的學習方法則是一條學好數(shù)據(jù)分析的“捷徑”。

王彥平

(網(wǎng)名“藍鯨”,電子書《從Excel到Python——數(shù)據(jù)分析進階指南》《從Excel到R——數(shù)據(jù)分析進階指南》《從Excel到SQL——數(shù)據(jù)分析進階指南》的作者)

2019年1月8日

主站蜘蛛池模板: 浦城县| 罗城| 北海市| 建昌县| 玉田县| 溧水县| 玉田县| 寿阳县| 溧水县| 嘉荫县| 深水埗区| 滨州市| 双桥区| 汕头市| 西盟| 崇州市| 榆社县| 绥宁县| 米易县| 莒南县| 丰台区| 鄱阳县| 铅山县| 望都县| 耿马| 赫章县| 贡山| 栾川县| 永胜县| 五寨县| 炎陵县| 江口县| 南木林县| 乡宁县| 汾阳市| 健康| 玛纳斯县| 通化县| 龙游县| 娄底市| 湄潭县|