官术网_书友最值得收藏!

1.5 將Python用于機器學習

Python是數據科學中最受歡迎的編程語言,這歸功于Python語言有非常多優秀的開發人員,而且其開源社區為數據科學提供了大量有價值的軟件庫。

對計算密集型任務而言,盡管像Python這樣的解釋性編程語言的性能趕不上低級編程語言,但是在Fortran和C的基礎上研發出的像NumPy和SciPy這樣的擴展軟件庫,可以實現多維數組的快速向量化操作。

機器學習的編程主要用scikit-learn,這是目前最常用且方便使用的開源機器學習軟件庫。在后面的章節中,當我們關注被稱為深度學習的機器學習子領域時,將使用新版本的TensorFlow軟件庫,利用圖形卡,專門訓練所謂的深度神經網絡。

1.5.1 利用Python Package Index安裝Python及其他軟件包

Python可用于微軟Windows、蘋果macOS和開源Linux這三大操作系統,可以從Python官網https://www.python.org下載安裝程序以及其相關的文檔。

本書的內容可用于Python 3.7或更新的版本,我們建議讀者使用可以獲得的Python 3最新版本。盡管有些代碼示例也可以與Python 2.7兼容,但是官方會停止對Python 2.7的支持,而且大多數的開源軟件庫已經停止對Python 2.7的支持(https://python3statement.org),因此,我們強烈建議讀者使用Python 3.7或者更新的版本。

本書所用的其他軟件包可以通過pip程序安裝,Python安裝程序從Python 3.3起就一直是標準庫的一部分。可以在https://docs.python.org/3/installing/index.html上發現更多關于pip的信息。

在成功地安裝了Python后,可以在終端上執行pip命令來安裝附加包:

026-01

對于已經安裝過的軟件包可以通過--upgrade選項完成升級:

026-02

1.5.2 采用Anaconda Python發行版和軟件包管理器

本書高度推薦由Continuum Analytics發行的Anaconda作為Python的科學計算軟件包。免費的Anaconda既可用于商業,也可供企業使用。該軟件包括數據科學、數學和工程在內的所有基本Python軟件包,并把它們組合在對用戶友好的跨平臺版本中??梢詮膆ttps://docs.anaconda.com/anaconda/install/網站下載Anaconda的安裝程序,從https://docs.anaconda.com/anaconda/user-guide/getting-started/網站下載Anaconda的快速啟動指南。

在成功地安裝了Anaconda之后,可以執行下述命令安裝其他Python軟件包:

027-01

安裝過的軟件包可以通過執行下述命令升級:

027-02

1.5.3 用于科學計算、數據科學和機器學習的軟件包

本書將主要使用NumPy的多維數組來存儲和操作數據。偶爾也會用pandas庫,該庫建立在NumPy之上,可以提供額外的更高級的數據操作工具,使表格數據的操作更加方便。為了增強學習體驗和可視化定量數據,我們將使用定制化程度非常高的Matplotlib軟件庫,這往往對直觀地理解解決方案極有價值。

現將本書所用的主要Python軟件包的版本號詳列如下,請讀者確保所安裝軟件包的版本不低于下述版本號,以確保代碼示例可以正確運行:

  • NumPy 1.17.4
  • SciPy 1.3.1
  • scikit-learn 0.22.0
  • Matplotlib 3.1.0
  • pandas 0.25.3
主站蜘蛛池模板: 乾安县| 南涧| 来安县| 临湘市| 长子县| 定陶县| 湾仔区| 娄底市| 稷山县| 江华| 额济纳旗| 伊春市| 凉山| 启东市| 神农架林区| 盐池县| 长兴县| 辉南县| 通海县| 龙岩市| 县级市| 临泉县| 荥经县| 枣庄市| 格尔木市| 永新县| 乌苏市| 顺昌县| 武冈市| 汽车| 济阳县| 华阴市| 凤阳县| 石门县| 阿勒泰市| 佛冈县| 龙里县| 岚皋县| 兴化市| 灵宝市| 响水县|