官术网_书友最值得收藏!

1.4 機器學習和深度學習

1.4.1 什么是機器學習

要說明什么是深度學習,首先要知道機器學習(Machine Learning,ML)、神經網絡、深度學習之間的關系。

眾所周知,機器學習是一種通過利用數據訓練出模型,然后使用模型預測的方法。與傳統的為解決特定任務、硬編碼的軟件程序不同,機器學習是用大量的數據來“訓練”的,通過各種算法從數據中學習如何完成任務。舉個簡單的例子,當我們瀏覽網上商城時,經常會出現商品推薦的信息。這是商城根據你往期的購物記錄和冗長的收藏清單識別出其中哪些是你真正感興趣的,并且愿意購買的產品。這樣的決策模型可以幫助商城為客戶提供建議并鼓勵產品消費。

機器學習是人工智能的子領域,機器學習理論主要是設計和分析一些讓計算機可以自動學習的算法。

舉個例子,假設要構建一個識別貓的程序。傳統上,如果我們想讓計算機進行識別,需要輸入一串指令,例如貓長著毛茸茸的毛、頂著一對三角形的耳朵等,然后計算機根據這些指令執行下去。但是,如果我們對程序展示一只老虎的照片,程序應該如何反應呢?更何況通過傳統方式要制定全部所需的規則,而且在此過程中必然涉及一些較難定義的概念,比如對毛茸茸的定義。因此,更好的方式是讓機器自學。我們可以為計算機提供大量的貓的照片,系統將以自己特有的方式查看這些照片。隨著實驗的反復進行,系統會不斷學習更新,最終能夠準確地判斷出哪些是貓,哪些不是貓。

我們不給機器規則,取而代之,我們“喂”給機器大量的針對某一任務的數據,讓機器自己學習,繼而挖掘出規律,從而具備完成某一任務的智能。機器學習是通過算法,使用大量數據進行訓練,訓練完成后會產生模型,將來有新的數據進來能夠進行準確的分類或預測。

機器學習的常用方法主要分為監督學習(Supervised Learning)和無監督學習(Unsupervised Learning)。

1.監督學習

監督學習需要使用有輸入和預期輸出標記的數據集。例如,指定的任務是使用一種圖像分類算法對男孩和女孩的圖像進行分類,那么男孩的圖像需要帶有“男孩”標簽,女孩的圖像需要帶有“女孩”標簽。這些數據被認為是一個訓練數據集,通過已有的訓練數據集(即已知數據及其對應的輸出)來訓練得到一個最優模型,這個模型就具備了對未知數據進行分類的能力。它之所以被稱為監督學習,是因為算法從訓練數據集學習的過程就像是一位老師正在監督學習。在我們預先知道正確的分類答案的情況下,算法對訓練數據不斷進行迭代預測,然后預測結果由“老師”進行不斷修正。當算法達到可接受的性能水平時,學習過程才會停止。

在人對事物的認知中,我們從小就被大人教授這是鳥,那是豬,那是房子,等等。我們所見到的景物就是輸入數據,而大人對這些景物的判斷結果(是房子還是鳥)就是相應的輸出。當我們見識多了以后,腦子里就慢慢地得到了一些泛化的模型,這就是訓練得到的那個(或者那些)函數,從而不需要大人在旁邊指點的時候,我們也能分辨出來哪些是房子,哪些是鳥。

2.無監督學習

無監督學習(也叫非監督學習)則是另一種研究得比較多的學習方法,它與監督學習的不同之處在于我們事先沒有任何訓練樣本,需要直接對數據進行建模。這聽起來有些不可思議,但是在我們認識世界的過程中很多地方都用到了無監督學習。比如我們去參觀一個畫展,我們對藝術一無所知,但是欣賞完多幅作品之后,也能把它們分成不同的派別(比如哪些更朦朧一點,哪些更寫實一些,即使我們不知道什么叫作朦朧派,什么叫作寫實派,但是至少能把它們分為兩個類別)。

主站蜘蛛池模板: 陆丰市| 扎兰屯市| 尚义县| 桃江县| 灌阳县| 工布江达县| 宁远县| 永城市| 南澳县| 巢湖市| 静海县| 木里| 许昌市| 石河子市| 三亚市| 青浦区| 柞水县| 铜山县| 博爱县| 桓台县| 阿图什市| 宁波市| 南阳市| 衡阳市| 娱乐| 杭锦后旗| 穆棱市| 平乡县| 田东县| 昭苏县| 张家港市| 友谊县| 兴城市| 张掖市| 团风县| 松阳县| 扶绥县| 闽侯县| 南通市| 黄龙县| 张家界市|