- Python機器學習(原書第3版)
- (美)塞巴斯蒂安·拉施卡 瓦希德·米爾賈利利
- 931字
- 2021-06-11 16:13:35
1.5 將Python用于機器學習
Python是數據科學中最受歡迎的編程語言,這歸功于Python語言有非常多優秀的開發人員,而且其開源社區為數據科學提供了大量有價值的軟件庫。
對計算密集型任務而言,盡管像Python這樣的解釋性編程語言的性能趕不上低級編程語言,但是在Fortran和C的基礎上研發出的像NumPy和SciPy這樣的擴展軟件庫,可以實現多維數組的快速向量化操作。
機器學習的編程主要用scikit-learn,這是目前最常用且方便使用的開源機器學習軟件庫。在后面的章節中,當我們關注被稱為深度學習的機器學習子領域時,將使用新版本的TensorFlow軟件庫,利用圖形卡,專門訓練所謂的深度神經網絡。
1.5.1 利用Python Package Index安裝Python及其他軟件包
Python可用于微軟Windows、蘋果macOS和開源Linux這三大操作系統,可以從Python官網https://www.python.org下載安裝程序以及其相關的文檔。
本書的內容可用于Python 3.7或更新的版本,我們建議讀者使用可以獲得的Python 3最新版本。盡管有些代碼示例也可以與Python 2.7兼容,但是官方會停止對Python 2.7的支持,而且大多數的開源軟件庫已經停止對Python 2.7的支持(https://python3statement.org),因此,我們強烈建議讀者使用Python 3.7或者更新的版本。
本書所用的其他軟件包可以通過pip
程序安裝,Python安裝程序從Python 3.3起就一直是標準庫的一部分。可以在https://docs.python.org/3/installing/index.html上發現更多關于pip
的信息。
在成功地安裝了Python后,可以在終端上執行pip
命令來安裝附加包:

對于已經安裝過的軟件包可以通過--upgrade
選項完成升級:

1.5.2 采用Anaconda Python發行版和軟件包管理器
本書高度推薦由Continuum Analytics發行的Anaconda作為Python的科學計算軟件包。免費的Anaconda既可用于商業,也可供企業使用。該軟件包括數據科學、數學和工程在內的所有基本Python軟件包,并把它們組合在對用戶友好的跨平臺版本中??梢詮膆ttps://docs.anaconda.com/anaconda/install/網站下載Anaconda的安裝程序,從https://docs.anaconda.com/anaconda/user-guide/getting-started/網站下載Anaconda的快速啟動指南。
在成功地安裝了Anaconda之后,可以執行下述命令安裝其他Python軟件包:

安裝過的軟件包可以通過執行下述命令升級:

1.5.3 用于科學計算、數據科學和機器學習的軟件包
本書將主要使用NumPy的多維數組來存儲和操作數據。偶爾也會用pandas庫,該庫建立在NumPy之上,可以提供額外的更高級的數據操作工具,使表格數據的操作更加方便。為了增強學習體驗和可視化定量數據,我們將使用定制化程度非常高的Matplotlib軟件庫,這往往對直觀地理解解決方案極有價值。
現將本書所用的主要Python軟件包的版本號詳列如下,請讀者確保所安裝軟件包的版本不低于下述版本號,以確保代碼示例可以正確運行:
- NumPy 1.17.4
- SciPy 1.3.1
- scikit-learn 0.22.0
- Matplotlib 3.1.0
- pandas 0.25.3
- Android Development with Kotlin
- Mastering OpenCV 4
- Java Web程序設計
- 數據結構(C語言)
- Flowable流程引擎實戰
- QGIS 2 Cookbook
- Python Machine Learning Blueprints:Intuitive data projects you can relate to
- App Inventor少兒趣味編程動手做
- C# 7.0本質論
- Python高性能編程(第2版)
- LiveCode Mobile Development Hotshot
- 3ds Max瘋狂設計學院
- Visual C++網絡編程教程(Visual Studio 2010平臺)
- PHP編程(第4版)
- Java從入門到精通(微視頻精編版)