- Python機器學習經典實例
- (美)普拉提克·喬西
- 2741字
- 2020-06-23 13:41:54
前言
在如今這個處處以數據驅動的世界中,機器學習正變得越來越大眾化。它已經被廣泛地應用于不同領域,如搜索引擎、機器人、無人駕駛汽車等。本書不僅可以幫你了解現實生活中機器學習的應用場景,而且通過有趣的菜譜式教程教你掌握處理具體問題的算法。
本書首先通過實用的案例介紹機器學習的基礎知識,然后介紹一些稍微復雜的機器學習算法,例如支持向量機、極端隨機森林、隱馬爾可夫模型、條件隨機場、深度神經網絡,等等。本書是為想用機器學習算法開發應用程序的Python程序員準備的。它不僅適合Python初學者(當然,熟悉Python編程方法將有助于體驗示例代碼),而且也適合想要掌握機器學習技術的Python老手。
通過本書,你不僅可以學會如何做出合理的決策,為自己選擇合適的算法類型,而且可以學會如何高效地實現算法以獲得最佳學習效果。如果你在圖像、文字、語音或其他形式的數據處理中遇到困難,書中處理這些數據的機器學習技術一定會對你有所幫助!
本書內容
第1章介紹各種回歸分析的監督學習技術。我們將學習如何分析共享自行車的使用模式,以及如何預測房價。
第2章介紹各種數據分類的監督學習技術。我們將學習如何評估收入層級,以及如何通過特征評估一輛二手汽車的質量。
第3章論述支持向量機的預測建模技術。我們將學習如何使用這些技術預測建筑物里事件發生的概率,以及體育場周邊道路的交通情況。
第4章闡述無監督學習算法,包括K-means聚類和均值漂移聚類。我們將學習如何將這些算法應用于股票市場數據和客戶細分。
第5章介紹推薦引擎的相關算法。我們將學習如何應用這些算法實現協同濾波和電影推薦。
第6章闡述與文本數據分析相關的技術,包括分詞、詞干提取、詞庫模型等。我們將學習如何使用這些技術進行文本情感分析和主題建模。
第7章介紹與語音數據分析相關的算法。我們將學習如何建立語音識別系統。
第8章介紹分析時間序列和有序數據的相關技術,包括隱馬爾可夫模型和條件隨機場。我們將學習如何將這些技術應用到文本序列分析和股市預測中。
第9章介紹圖像內容分析與物體識別方面的算法。我們將學習如何提取圖像特征,以及建立物體識別系統。
第10章介紹在圖像和視頻中檢測與識別面部的相關技術。我們將學習使用降維算法建立面部識別器。
第11章介紹建立深度神經網絡所需的算法。我們將學習如何使用神經網絡建立光學文字識別系統。
第12章介紹機器學習使用的數據可視化技術。我們將學習如何創建不同類型的圖形和圖表。
閱讀背景
Python 2.x和Python 3.x的版本之爭尚未平息。一方面,我們堅信世界會向更好的版本不斷進化,另一方面,許多開發者仍然喜歡使用Python 2.x的版本。目前許多操作系統仍然內置Python 2.x。本書的重點是介紹Python機器學習,而非Python語言本身。另外,考慮到程序的兼容性,書中用到了一些尚未被遷移到Python 3.x版本的程序庫,因此,本書依然選擇Python 2.x的版本。我們會盡最大努力保持代碼兼容各種Python版本,因為這樣可以讓你輕松地理解代碼,并且很方便地將代碼應用到不同場景中。
讀者對象
本書是為想用機器學習算法開發應用程序的Python程序員準備的。它適合Python初學者閱讀,不過熟悉Python編程方法對體驗示例代碼大有裨益。
內容組織
在本書中,你會頻繁地看到下面這些標題(準備工作、詳細步驟、工作原理、更多內容、另請參閱)。
為了更好地呈現內容,本書采用以下組織形式。
準備工作
這部分首先介紹本節目標,然后介紹軟件配置方法以及所需的準備工作。
詳細步驟
這部分介紹具體的實踐步驟。
工作原理
這部分通常是對前一部分內容的詳細解釋。
更多內容
這部分會補充介紹一些信息,幫助你更好地理解前面的內容。
另請參閱
這部分提供一些參考資料。
排版約定
在本書中,你會發現一些不同的文本樣式。這里舉例說明它們的含義。
嵌入代碼、命令、選項、參數、函數、字段、屬性、語句等,用等寬的代碼字體顯示:“這里,我們將25%的數據用于測試,可以通過test_size參數進行設置。”
代碼塊用如下格式:
import numpy as np import matplotlib.pyplot as plt import utilities # Load input data input_file='data_multivar.txt' X, y=utilities.load_data(input_file)
命令行輸入或輸出用如下格式:
$ python object_recognizer.py --input-image imagefile.jpg --model-file erf.pkl --codebook-file codebook.pkl
新術語和重要文字將采用黑體字。你在屏幕上看到的內容,包括對話框或菜單里的文本,都將這樣顯示:“如果你將數組改為(0, 0.2, 0, 0, 0),那么Strawberry部分就會高亮顯示。”
讀者反饋
我們非常歡迎讀者的反饋。如果你對本書有些想法,有什么喜歡或是不喜歡的,請反饋給我們,這將有助于我們出版充分滿足讀者需求的圖書。
一般性反饋請發送電子郵件至feedback@packtpub.com,并在郵件主題中注明書名。
如果你在某個領域有專長,并有意編寫一本書或是貢獻一份力量,請參考我們的作者指南,地址為http://www.packtpub.com/authors。
客戶支持
你現在已經是引以為傲的Packt讀者了。為了能讓你的購買物超所值,我們還為你準備了以下內容。
下載示例代碼
你可以用你的賬戶從http://www.packtpub.com下載所有已購買Packt圖書的示例代碼文件。如果你是從其他途徑購買的本書,可以訪問http://www.packtpub.com/support并注冊,我們將通過電子郵件把文件發送給你。
可以通過以下步驟下載示例代碼文件:
(1) 用你的電子郵件和密碼登錄或注冊我們的網站;
(2) 將鼠標移到網站上方的客戶支持(SUPPORT)標簽;
(3) 單擊代碼下載與勘誤(Code Downloads & Errata)按鈕;
(4) 在搜索框(Search)中輸入書名;
(5) 選擇你要下載代碼文件的書;
(6) 從下拉菜單中選擇你的購書途徑;
(7) 單擊代碼下載(Code Download)按鈕。
你也可以通過單擊Packt網站上本書網頁上的代碼文件(Code Files)按鈕來下載示例代碼,該網頁可以通過在搜索框(Search)中輸入書名獲得。以上操作的前提是你已經登錄了Packt網站。
下載文件后,請確保用以下軟件的最新版來解壓文件:
? WinRAR / 7-Zip for Windows;
? Zipeg / iZip / UnRarX for Mac;
? 7-Zip / PeaZip for Linux。
本書的代碼包也可以在GitHub上獲得,網址是https://github.com/PacktPublishing/Python-Machine-Learning-Cookbook。另外,我們在https://github.com/PacktPublishing上還有其他書的代碼包和視頻,請需要的讀者自行下載。
下載本書的彩色圖片
我們也為你提供了一份PDF文件,里面包含了書中的截屏和圖表等彩色圖片,彩色圖片能幫助你更好地理解輸出的變化。下載網址為https://www.packtpub.com/sites/default/files/downloads/PythonMachineLearningCookbook_Colorimages.pdf。
勘誤
雖然我們已盡力確保本書內容正確,但出錯仍舊在所難免。如果你在書中發現錯誤,不管是文本還是代碼,希望能告知我們,我們將不勝感激。這樣做,你可以使其他讀者免受挫敗,也可以幫助我們改進本書的后續版本。如果你發現任何錯誤,請訪問http://www.packtpub.com/submit-errata,選擇本書,單擊勘誤表提交表單(Errata Submission Form)的鏈接,并輸入詳細說明。勘誤一經核實,你提交的內容將被接受,此勘誤會上傳到本公司網站或添加到現有勘誤表。
訪問https://www.packtpub.com/books/content/support,在搜索框中輸入書名,可以在勘誤(Errata)部分查看已經提交的勘誤信息。
盜版
任何媒體都會面臨版權內容在互聯網上的盜版問題,Packt也不例外。Packt非常重視版權保護。如果你發現我們的作品在互聯網上被非法復制,不管以什么形式,都請立即為我們提供相關網址或網站名稱,以便我們尋求補救。
請把可疑盜版材料的鏈接發到copyright@packtpub.com。
保護我們的作者,就是保護我們繼續為你帶來價值的能力,我們將不勝感激。
問題
如果你對本書內容存有疑問,不管是哪個方面的,都可以通過questions@packtpub.com聯系我們,我們會盡最大努力解決。
電子書
掃描如下二維碼,即可獲得本書電子版。

- 無代碼編程:用云表搭建企業數字化管理平臺
- Learning SQLite for iOS
- NumPy Essentials
- Internet of Things with Intel Galileo
- MySQL數據庫管理與開發(慕課版)
- JavaScript 程序設計案例教程
- The Complete Coding Interview Guide in Java
- Linux Device Drivers Development
- 編程菜鳥學Python數據分析
- Windows Embedded CE 6.0程序設計實戰
- Python3.5從零開始學
- Couchbase Essentials
- 人工智能算法(卷1):基礎算法
- HTML5+CSS3+JavaScript 從入門到項目實踐(超值版)
- CodeIgniter Web Application Blueprints