官术网_书友最值得收藏!

前言 / PREFACE

人工智能(Artificial Intelligence,AI)是一個覆蓋許多下級學科的寬泛領域,本系列圖書涵蓋了當中的部分特定主題,而本書則是系列書的第1卷。接下來幾小節將會對本系列圖書和本卷一一進行介紹。

本系列圖書將向讀者介紹人工智能領域的各種熱門主題。由于人工智能是一個龐大而繁雜的領域,并且其涵蓋的內容與日俱增,任何一本書都只可能專注于特定領域,因此本書也無意成為一本巨細靡遺的人工智能教程。

本系列圖書以一種數學上易于理解的方式講授人工智能相關概念,這也是本系列圖書英文書名中“for Human”的含義。此外:

● 本系列圖書假定讀者精通至少一門編程語言;

● 本系列圖書假定讀者對大學代數課程有基本的了解;

● 本系列圖書將使用微積分、線性代數、微分方程與統計學中的相關概念和公式;

● 但是在解釋上述第3點的相關內容時,本系列圖書并不會假定讀者對相關內容十分熟練;

● 所有概念都不僅有數學公式,還附有編程實例和偽代碼。

本系列圖書的目標讀者是精通至少一門編程語言的程序員,且書中示例均已改寫為多種編程語言的形式。

編程語言

本書中只是給出了偽代碼,而具體示例代碼則以Java、C#、R、C/C++和Python等語言形式提供,此外還有社區支持維護的Scala語言版本。社區成員們正在努力將示例代碼轉換為更多其他的編程語言,說不定當你拿到本書的時候,你喜歡的編程語言也有了相應的示例代碼。訪問本書的GitHub開源倉庫可以獲取更多信息,同時我們也鼓勵社區協作來幫我們完成代碼改寫和移植工作。如果你也希望加入協作,我們將不勝感激。更多相關流程信息可以參見本書附錄A。

在線實驗環境

所有的線上實驗環境資料均可在以下網址中找到:

http://www.aifh.org

這些在線環境使你就算是在移動設備上閱讀電子書時也能嘗試各種示例。

代碼倉庫

本系列圖書中的所有代碼均基于開源許可證Apache 2.0發布,相關內容可以在以下GitHub開源庫中獲取:

https://github.com/jeffheaton/aifh

附帶JavaScript實驗環境示例的在線實驗環境則保存在以下GitHub開源庫中:

https://github.com/jeffheaton/aifh-html[1]

如果你發現有任何疏漏抑或不妥之處,歡迎在GitHub上分叉項目并推送提交來進行修訂,你也將可以成為日益壯大的貢獻者群體之一。更多關于貢獻代碼的信息請參見本書附錄A。

本系列圖書的寫作計劃:

● 卷0:AI數學入門;

● 卷1:基礎算法;

● 卷2:自然啟發算法;

● 卷3:深度學習和神經網絡;

● 卷4:支持向量機;

● 卷5:概率學習。

卷1~卷5將會依次出版;而卷0則會作為“提前計劃好的前傳”,在本系列圖書的出版接近尾聲之際完成。卷1~卷5會講解必要的數學概念,卷0則會專注于對這些概念進行回顧,并在此基礎上進行一定的拓展。

卷0既可以是閱讀本系列圖書的開端,也可以作為本系列圖書的總結;卷1的閱讀順序最好在后續幾卷之前;卷2的部分內容對讀者理解卷3的內容又有所助益。圖1展示了我們建議的合理的閱讀順序。

本系列圖書的每一卷均可獨立閱讀,也可作為本系列圖書整體閱讀。但需要注意的是,卷1中列出了后續各卷所使用的各種基本算法,并且這些算法本身既是基礎,也不失實用性。

圖1 卷目閱讀流程

其他資源

當你在閱讀本書的時候,互聯網上還有很多別的資源可以幫助到你。

首先是可汗學院,上面收集整理了許多講授各種數學概念的YouTube視頻。你要是需要復習某個概念,可汗學院上很可能就有你需要的視頻講解,讀者可以自行查找。

其次是網站“神經網絡常見問答”。作為一個純文本資源,上面擁有大量神經網絡和其他人工智能領域的相關信息:

http://www.faqs.org/faqs/ai-faq/neural-nets/

此外,Encog項目的wiki頁面也有許多機器學習方面的內容,并且這些內容并不局限于Encog項目:

http://www.heatonresearch.com/wiki/Main_Page

最后,Encog的論壇上也可以討論人工智能和神經網絡相關話題,這些論壇都非常活躍,你的問題很可能會得到某個社區成員甚至是我本人的回復:

http://www.heatonresearch.com/forum

欲建高樓,必重基礎。本書會講授諸如維度法、距離度量算法、聚類算法、誤差計算、爬山算法、線性回歸和離散學習這樣的人工智能算法。這些算法對應于數據中特定模式的處理和識別,同時也是亞馬遜(Amazon)和網飛(Netflix)這類網站中,各種推薦系統背后的邏輯。

這些算法不僅是后續各卷所介紹的算法的基礎,其本身也大有用處。在本書中,這些算法的講解均附以可操作性強的數值計算示例。

第1章“AI入門”,介紹了本書或本系列圖書其他各卷中會用到的部分人工智能相關的基本概念。大多數人工智能算法是接受一個輸入數組,從而產生一個輸出數組—人工智能所能解決的問題通常被歸化為此類模型。而在算法模型內部,還需要有額外的數組來存儲長短期記憶。算法的訓練實際上就是通過調整長期記憶的值來產生對應于給定輸入的預期輸出的一個過程。

第2章“數據歸一化”,描述了大多數人工智能算法對原始數據的預處理流程。數據需要以一個輸入數組的形式傳遞給算法,但實踐中獲取到的數據并不一定都是數值型的,也有一些是類別信息,比如顏色、形狀、性別、物種抑或其他一些非數值型的描述性特征。此外,就算是現成的數值型數據,也必須在一定范圍內歸一化,并且通常是歸一化到 (-1, 1) 區間。

第3章“距離度量”,展示了我們比較數據的方法,說起來這種比較方法其實跟在地圖上標識出兩點間的距離十分相像。人工智能通常以數值數組的形式處理數據,包括輸入數據、輸出數據、長期記憶、短期記憶和其他很多數據都是如此,這些數組很多時候也被稱作“向量”。我們可以像計算兩點間距離一樣,計算出兩個數據之間的差異(二維和三維的點可以分別看作長度為二和三的向量)。當然,在人工智能領域,我們經常要處理的是更高維空間中的數據。

第4章“隨機數生成”,講解了人工智能算法中隨機數的生成和使用。本章由關于均勻隨機數和正態隨機數的討論切入——出現這種不同的根源在于有的時候算法要求隨機數具有等可能性,而有的時候又需要它們服從某種既定的分布。此外本章還討論了生成隨機數的方法。

第5章“K均值聚類算法”,詳述了將數據按相似度分類的方法。K均值算法本身可以用來將數據按共性分組,同時也可以被用于組成更復雜的算法—比如遺傳算法就利用K均值算法對種群按特征歸類,各路網商也利用聚類算法劃分顧客,依照同類型顧客的消費習慣調整銷售策略。

第6章“誤差計算”,演示了評估人工智能算法效果的方法。誤差計算的過程由一個用以評估算法最終效果的評分函數執行,其結果決定了算法的效果。一類常用的評分函數只需要給定輸入向量和預期輸出向量,也就是所謂的“訓練數據”;算法的效果則由實際輸出與預期輸出間的差異決定。

第7章“邁向機器學習”,概述了可以從數據中學習特征來優化結果的簡單機器學習算法。大多數人工智能算法是用權值向量將輸入向量轉化為期望的輸出向量,這些權值向量構成了算法的長期記憶,“訓練”就是一個調整長期記憶以產生預期輸出的過程。本章會演示幾個具有學習能力的簡單模型的構建方法,也會介紹一些簡單但卻行之有效的訓練算法,能夠調整這種長期記憶(權重向量)并優化輸出結果—簡單隨機漫步和爬山算法正是其中之二。

第8章“優化訓練”,在前面章節的基礎上進行了一定的拓展,介紹了像模擬退火算法和Nelder-Mead法[2]這樣用來快速優化人工智能模型權重的算法。本章還說明了如何通過一定的調整,將這些優化算法應用于之前提到過的部分模型。

第9章“離散優化”,解釋了如何優化非數值型的類別型數據。并非所有優化問題都是數值型的,還有離散型和類別型問題,比如背包問題和旅行商問題。本章將說明模擬退火算法可以用于處理這兩個問題,并且該算法既適用于連續的數值型問題,也適用于離散的類別型問題。

第10章“線性回歸”,講解了如何用線性和非線性方程來學習趨勢并做出預測。本章將介紹簡單線性回歸,并演示如何用它來擬合數據為線性模型。此外還將介紹可以擬合非線性數據的廣義線性模型(General Linear Model,GLM)。

作為一次成功的眾籌產物,本系列圖書才得以在2013年面世。

我衷心地感謝該項目的所有支持者,沒有你們的支持就沒有這套叢書。我還要特別感謝那些贊助超過100美元的支持者。這些支持者們按贊助順序排列的名單如下。

此外還要特別感謝Rick Cardarelle,他贊助的358美元一舉使項目金額達到了要求的最低數額2500美元。也特別感謝Rory Graves和Matic Potocnik將示例代碼轉換為Scala代碼。

謝謝大家,你們都是最友善的人!


[1] 定向內容已失效,讀者可考慮訪問另一個網址:https://www.heatonresearch.com/aifh/——譯者注。

[2] 也稱“下坡單純形法”“變形蟲法”或“多胞形法”,是一種在多維空間中求目標函數最大/最小值的常用數值方法。由John Nelder和Roger Mead于1965年提出。——譯者注

主站蜘蛛池模板: 苍南县| 准格尔旗| 江山市| 驻马店市| 长乐市| 澄江县| 搜索| 营口市| 龙山县| 金平| 乌拉特后旗| 黔西| 永宁县| 蓬莱市| 太康县| 济源市| 垦利县| 南京市| 清徐县| 读书| 新巴尔虎左旗| 安龙县| 江华| 丰宁| 乌恰县| 陆河县| 衡南县| 枞阳县| 旬邑县| 北碚区| 喜德县| 石狮市| 房产| 清新县| 克拉玛依市| 彝良县| 崇义县| 沙洋县| 泰来县| 都兰县| 二连浩特市|