- 利用Python進行數據分析(原書第3版)
- (美)韋斯·麥金尼
- 970字
- 2024-03-04 16:53:18
譯者序
2017年9月,我以SeanCheney為網名在互聯網上寫作、翻譯了一系列文章,內容包括Python數據分析、爬蟲、機器學習。出乎意料地,在隨后的5年時間里,我得以接觸成千上萬的讀者,其中既有各種專業的學生,也有從事不同行業的職場人士。這讓我認識到,除了程序員,越來越多的人正在學習數據分析。身處大數據時代,數據分析能力正逐漸成為現代人不可或缺的一項技能。
在數據分析領域,本書是最值得閱讀的圖書之一。首先,Python這門語言非常適合初學者。得益于簡潔的語法,Python代碼的可讀性非常好,即便非計算機專業的讀者也能快速掌握它。本書正是以Python作為編程語言來講解數據分析的,不僅學習門檻低,而且上手快。其次,對于已經入門Python的讀者,數據分析是非常好的進階學習內容。當掌握數據分析之后,讀者可以繼續學習機器學習、深度學習或者量化金融等。pandas庫是使用Python進行數據分析最主要的工具,而本書作者正是pandas庫的創建者,因此對知識點的講解十分親切、流暢、自然。最后,本書提供了非常豐富的學習內容,涉及機器學習、統計、時間序列分析、數據可視化。經過三版的迭代,本書的知識體系更加合理和系統化。如果讀者能跟隨本書示例學習并勤加練習,一定能收獲學習和精進的樂趣。
本書第3版最大的變化是緊貼pandas的升級進行擴展,將pandas升級為1.4.0,將Python升級為3.10,主要是新增了方法和特性等內容。作者為第11章新增了分組時間重采樣,并將第2版中第12章的內容前置到本書第7章中。曾經不止一次聽別人抱怨,pandas的知識點分散、零碎、不便于記憶,作者在細節上也對此進行了改進。在本書中,作者摒棄了許多容易造成記憶混亂的用法,比如,用axis="columns"替代axis=1。簡寫方式破壞了代碼的可讀性,作者修改了許多類似的編程細節。本書對初學者更為友好了!
早在Python成為主力的數據分析工具之前,Excel、MATLAB、R都是強有力的競爭者。Python能后來居上,除了它極易上手的特性,主要還是歸功于開源。本書作者Wes McKinney是開源界的先鋒,他早年創建了pandas,后來完全依托開源社群對其維護。社群中不乏優秀的開發者,眾人合力推動pandas持續進步,pandas才有如今的影響力。正是因為這種純粹的開源理念,Wes專門為本書搭建了開源的網頁版本,相信pandas社區不僅會進一步壯大,還會迎來一大批新用戶和讀者。
很高興能與機械工業出版社合作,本人能力有限,盡管我已多次校閱過書稿,但疏漏之處在所難免。如果讀者發現書中錯誤,非常歡迎通過電子郵箱seancheney@qq.com向我反饋。
陳松
清華大學科學館
- 樂學Web編程:網站制作不神秘
- Mastering matplotlib
- Visual Basic程序設計習題解答與上機指導
- STM32F0實戰:基于HAL庫開發
- 零基礎入門學習Python
- Swift 4 Protocol-Oriented Programming(Third Edition)
- Java程序設計案例教程
- Developing SSRS Reports for Dynamics AX
- R數據科學實戰:工具詳解與案例分析
- 實戰Java高并發程序設計(第2版)
- Go語言從入門到精通
- 嵌入式Linux C語言程序設計基礎教程
- Mastering Embedded Linux Programming
- 算法秘籍
- Mastering Leap Motion