官术网_书友最值得收藏!

譯者序

2017年9月,我以SeanCheney為網名在互聯網上寫作、翻譯了一系列文章,內容包括Python數據分析、爬蟲、機器學習。出乎意料地,在隨后的5年時間里,我得以接觸成千上萬的讀者,其中既有各種專業的學生,也有從事不同行業的職場人士。這讓我認識到,除了程序員,越來越多的人正在學習數據分析。身處大數據時代,數據分析能力正逐漸成為現代人不可或缺的一項技能。

在數據分析領域,本書是最值得閱讀的圖書之一。首先,Python這門語言非常適合初學者。得益于簡潔的語法,Python代碼的可讀性非常好,即便非計算機專業的讀者也能快速掌握它。本書正是以Python作為編程語言來講解數據分析的,不僅學習門檻低,而且上手快。其次,對于已經入門Python的讀者,數據分析是非常好的進階學習內容。當掌握數據分析之后,讀者可以繼續學習機器學習、深度學習或者量化金融等。pandas庫是使用Python進行數據分析最主要的工具,而本書作者正是pandas庫的創建者,因此對知識點的講解十分親切、流暢、自然。最后,本書提供了非常豐富的學習內容,涉及機器學習、統計、時間序列分析、數據可視化。經過三版的迭代,本書的知識體系更加合理和系統化。如果讀者能跟隨本書示例學習并勤加練習,一定能收獲學習和精進的樂趣。

本書第3版最大的變化是緊貼pandas的升級進行擴展,將pandas升級為1.4.0,將Python升級為3.10,主要是新增了方法和特性等內容。作者為第11章新增了分組時間重采樣,并將第2版中第12章的內容前置到本書第7章中。曾經不止一次聽別人抱怨,pandas的知識點分散、零碎、不便于記憶,作者在細節上也對此進行了改進。在本書中,作者摒棄了許多容易造成記憶混亂的用法,比如,用axis="columns"替代axis=1。簡寫方式破壞了代碼的可讀性,作者修改了許多類似的編程細節。本書對初學者更為友好了!

早在Python成為主力的數據分析工具之前,Excel、MATLAB、R都是強有力的競爭者。Python能后來居上,除了它極易上手的特性,主要還是歸功于開源。本書作者Wes McKinney是開源界的先鋒,他早年創建了pandas,后來完全依托開源社群對其維護。社群中不乏優秀的開發者,眾人合力推動pandas持續進步,pandas才有如今的影響力。正是因為這種純粹的開源理念,Wes專門為本書搭建了開源的網頁版本,相信pandas社區不僅會進一步壯大,還會迎來一大批新用戶和讀者。

很高興能與機械工業出版社合作,本人能力有限,盡管我已多次校閱過書稿,但疏漏之處在所難免。如果讀者發現書中錯誤,非常歡迎通過電子郵箱seancheney@qq.com向我反饋。

陳松

清華大學科學館

主站蜘蛛池模板: 杭州市| 凤冈县| 庆城县| 望城县| 家居| 宜黄县| 绥阳县| 察雅县| 章丘市| 扎赉特旗| 溧水县| 新建县| 汉川市| 扶沟县| 临海市| 陵川县| 桃园县| 喜德县| 陆川县| 印江| 筠连县| 山东省| 区。| 大庆市| 岑巩县| 马关县| 江山市| 江安县| 山阴县| 武宁县| 保亭| 法库县| 炉霍县| 白朗县| 伊宁市| 通州区| 根河市| 洮南市| 托克托县| 新昌县| 乡宁县|