官术网_书友最值得收藏!

本書代碼

本書使用的代碼和數據都可從GitHub(https://github.com/AllenDoweny/ThinkStats2)下載。Git是一個版本管理系統,可以對項目文件進行跟蹤。受Git管理的文件集稱為代碼庫(repository)。GitHub是一項托管服務,可以存儲Git代碼庫,并提供一個便于使用的Web接口。

我的GitHub主頁提供以下幾種使用代碼的方法。

?你可以點擊Fork按鈕,在GitHub上創建該代碼庫的副本。如果你還沒有GitHub賬號,就需要創建一個。創建副本之后,你就在GitHub上擁有了自己的代碼庫,可以跟蹤學習本書時編寫的代碼。之后你可以復制這個代碼庫,即將文件復制到自己的計算機上。

?或者,你也可以復制我的代碼庫。這一操作不需要GitHub賬號,但是你對代碼所做的修改無法寫回GitHub。

?如果你完全不想使用Git,那么可以點擊GitHub頁面右下角的按鈕,下載文件的Zip包。

本書所有代碼都無需翻譯即可在Python 2和Python 3中直接運行。

編寫本書代碼時,我使用的是Continuum Analytics的Anaconda,這是一個免費的Python版本,其中帶有運行本書代碼所需的所有軟件包(還有很多其他包)。Anaconda很容易安裝。默認情況下,Anaconda進行用戶級而非系統級安裝,因此不需要管理員權限。Anaconda同時支持Python 2和Python 3,你可以從Continuum(http://continuum.io/downloads)進行下載。

如果你不想使用Anaconda,那么需要安裝以下軟件包。

?pandas,進行數據的表示和分析。下載地址為:http://pandas.pydata.org/。

?NumPy,支持基本的數字運算。下載地址為:http://www.numpy.org/。

?SciPy,進行科學計算,包括統計運算。下載地址為:http://www.scipy.org/。

?StatsModels,進行回歸分析和其他統計分析。下載地址為:http://statsmodels.sourceforge.net/。

?matplotlib,支持可視化。下載地址為:http://matplotlib.org/。

雖然這些都是常用軟件包,但并不是所有的Python安裝都包含這些包,而且在有些環境下很難進行安裝。如果你無法安裝這些包,我強烈建議你使用Anaconda,或者包含這些包的其他Python版本。

當你復制完代碼庫或者將Zip包解壓后,會得到一個名為ThinkStats2/code的文件夾,其中有一個nsfg.py文件。運行nsfg.py會讀取一個數據文件,運行一些測試,并輸出一條消息,如“All tests passed”。如果你得到的是import error,可能是因為缺少某些必要的軟件包。

本書的大部分練習都使用Python腳本,但也有一些使用IPython記事本。如果你之前沒有用過IPython記事本,可以訪問文檔http://ipython.org/ipython-doc/stable/notebook/notebook.html得到幫助。

本書讀者應該熟悉Python的核心功能,包括面向對象的特征,但無需具備pandas、NumPy和SciPy知識。如果你已經熟知這些模塊,可以跳過一些相關小節。

本書讀者應該了解基本的數學知識,例如對數和求和。本書中有幾處會涉及微積分概念,但你無需進行微積分運算。

如果你從未學習過統計學,本書會是一本很好的入門教材。如果你學習過傳統的統計學課程,那么我希望本書能夠修正你過去接受的一些錯誤觀點。

Allen B. Downey是一位計算機科學教授,執教于美國馬薩諸塞州尼德姆的富蘭克林歐林工程學院。

主站蜘蛛池模板: 庆云县| 通化县| 鄱阳县| 玉龙| 绥棱县| 铜鼓县| 邯郸市| 曲阳县| 西和县| 永昌县| 贡山| 县级市| 泸州市| 大理市| 彭山县| 黄大仙区| 和政县| 宣化县| 太康县| 健康| 宁津县| 娱乐| 冕宁县| 江都市| 萨嘎县| 柳州市| 苏尼特右旗| 开原市| 阳春市| 鄂伦春自治旗| 自治县| 盐源县| 于田县| 洪泽县| 大方县| 合山市| 娄底市| 斗六市| 张北县| 延庆县| 漠河县|