官术网_书友最值得收藏!

1.3 深度學(xué)習(xí)的不同種類

深度學(xué)習(xí)一般可以分為三類:監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。在本節(jié)中,我們將逐個(gè)講解。

1.3.1 監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí),顧名思義就是需要人工參與,將數(shù)據(jù)預(yù)先打好標(biāo)簽后再進(jìn)行訓(xùn)練的學(xué)習(xí)方式。我們以汽車圖片的識別為例來介紹這個(gè)過程。

1.數(shù)據(jù)集的創(chuàng)建和分類

假設(shè)有許多汽車和飛機(jī)的圖片集(數(shù)據(jù)集),我們需要先人工標(biāo)識出所有圖片對應(yīng)的種類,然后進(jìn)行訓(xùn)練。為了驗(yàn)證算法的正確性和避免過擬合,我們將這些圖片分為兩部分,一部分(訓(xùn)練數(shù)據(jù))用來訓(xùn)練算法,另一部分(驗(yàn)證數(shù)據(jù))用來驗(yàn)證算法的識別準(zhǔn)確度。

從數(shù)學(xué)的角度看,我們要在深度網(wǎng)絡(luò)中找到一個(gè)合適的分類函數(shù),函數(shù)的入?yún)⑹菆D片,即一個(gè)矩陣,當(dāng)圖片是汽車時(shí)輸出1,否則輸出0。這個(gè)步驟我們叫作分類任務(wù),這里為了簡化問題,我們輸出的結(jié)果為是或否。一般來說,輸出結(jié)果也可能是一組值,例如,圖片是汽車的概率(一個(gè)0~1的值),這個(gè)過程我們稱為回歸。

2.訓(xùn)練

一個(gè)簡化的訓(xùn)練過程是給定一個(gè)輸出(一般包含多個(gè)參數(shù)),然后通過一個(gè)函數(shù)計(jì)算出一組數(shù)值,再通過一個(gè)規(guī)則得出一個(gè)輸出節(jié)點(diǎn)。整個(gè)過程從左到右逐層計(jì)算,當(dāng)遇到復(fù)雜問題時(shí)我們通常會通過添加層數(shù)來解決。

雖然得出了結(jié)果,但這個(gè)結(jié)果并不一定是正確的。因此需要將正確的結(jié)果反饋給網(wǎng)絡(luò)來進(jìn)行修正,此時(shí)可以使用一個(gè)稱為成本函數(shù)(也稱為目標(biāo)函數(shù)、效用函數(shù)或適應(yīng)度函數(shù))的函數(shù)來量化這個(gè)偏差,然后將這個(gè)偏差從右到左反向傳播給網(wǎng)絡(luò)來對參數(shù)進(jìn)行修正,這個(gè)過程稱為反向傳播。

針對每個(gè)訓(xùn)練項(xiàng)目重復(fù)訓(xùn)練動作,盡量最小化成本函數(shù),即可達(dá)到我們理想的效果。數(shù)學(xué)中有很多模型可以達(dá)到這個(gè)效果,但一般最常用的是一個(gè)稱為梯度下降的方法,下文會涉及具體的細(xì)節(jié)。

3.驗(yàn)證

當(dāng)訓(xùn)練完成后,我們需要檢驗(yàn)剛才的結(jié)果,此時(shí)會用到另一部分?jǐn)?shù)據(jù)集,即驗(yàn)證數(shù)據(jù)。根據(jù)驗(yàn)證出來的結(jié)果,我們可能需要調(diào)整剛才訓(xùn)練用的模型,如增加更多的參數(shù)、層數(shù),使成本函數(shù)的結(jié)果更有效地反向傳播等。然后重復(fù)訓(xùn)練和驗(yàn)證過程,這個(gè)過程可能會重復(fù)很多次。

4.使用

當(dāng)模型達(dá)到預(yù)期標(biāo)準(zhǔn)后,我們就可以將其部署到應(yīng)用中了。

從上述內(nèi)容可以看出,監(jiān)督學(xué)習(xí)對數(shù)據(jù)集的要求比較高,并且一般需要大量的數(shù)據(jù)集才能訓(xùn)練出一個(gè)準(zhǔn)確的模型。雖然訓(xùn)練模型的代價(jià)可能比較大,但是訓(xùn)練模型的結(jié)果是十分有價(jià)值的。例如,在醫(yī)學(xué)中識別一個(gè)腫瘤是良性的還是惡性的就是一個(gè)很有價(jià)值的預(yù)測,我們?yōu)榇烁冻龅拇鷥r(jià)是值得的。

1.3.2 無監(jiān)督學(xué)習(xí)

無監(jiān)督學(xué)習(xí)不需要人為地為數(shù)據(jù)加上標(biāo)簽,但可以產(chǎn)生預(yù)期結(jié)果。無監(jiān)督學(xué)習(xí)能自動分析數(shù)據(jù)嘗試找出其中的模式,因此相較于監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)具有更好的適應(yīng)性和更廣的應(yīng)用場景,但也具有更高的難度。

如果你是一家購物網(wǎng)站的負(fù)責(zé)人,如何快速準(zhǔn)確地發(fā)掘最近客戶非常感興趣的商品將是你非常關(guān)心的事情。如果有一個(gè)算法能自動分析訂單情況,找出客戶感興趣的商品分類,我想這一定會使你非常開心。

我們經(jīng)常在工業(yè)化場景中使用的無監(jiān)督學(xué)習(xí)算法有以下幾種。

○ 自編碼(Autoencoding)。

○ 主成分分析(Principal Components Analysis)。

○ 隨機(jī)森林(Random Forests)。

K均值聚類(K-means Clustering)。

最近,無監(jiān)督學(xué)習(xí)非常有潛力的發(fā)展方向是Ian Goodfellow提出的生成對抗網(wǎng)絡(luò)。其原理是,創(chuàng)建兩個(gè)神經(jīng)網(wǎng)絡(luò)并賦予它們不同的職責(zé),一個(gè)用來生產(chǎn)欺騙對方的數(shù)據(jù)集,另外一個(gè)用來識別數(shù)據(jù)的真假。這種想法產(chǎn)生了一些驚人的成果,如可以通過字符串生成逼真圖片的 AI程序。

不過無監(jiān)督學(xué)習(xí)也不是萬能的,比如我們在進(jìn)行分類時(shí),被分類的對象之間必須是有內(nèi)在聯(lián)系的,不能是毫無關(guān)聯(lián)的。另外需要有一定的模式可以用來區(qū)分這些對象。如果不滿足這些條件,無監(jiān)督學(xué)習(xí)也是無能為力的。

通過上面的描述我們可以了解到監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)各有自己的優(yōu)勢和劣勢。那么是否可以將這兩種結(jié)合起來呢?基于此,半監(jiān)督學(xué)習(xí)應(yīng)運(yùn)而生,半監(jiān)督學(xué)習(xí)可以在相對于監(jiān)督學(xué)習(xí)擁有更少量的標(biāo)簽數(shù)據(jù)集的情況下得到符合預(yù)期的訓(xùn)練結(jié)果,這樣成本更低。這里有個(gè)例子可以說明這種情況,之前我們擁有一個(gè)自動分類的算法,在監(jiān)督學(xué)習(xí)下每個(gè)類別大致需要1360個(gè)標(biāo)簽,而改成半監(jiān)督學(xué)習(xí)之后每個(gè)類別需要的標(biāo)簽減少到30個(gè)。不僅所需標(biāo)簽的數(shù)量減少,能識別的類別也從之前的20個(gè)到擴(kuò)展到110個(gè)。

因此在數(shù)據(jù)標(biāo)簽較少的情況下,即使不知道結(jié)果,也能預(yù)測可能出現(xiàn)的值和概率。

1.3.3 強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)類似于無監(jiān)督學(xué)習(xí),預(yù)測結(jié)果時(shí)也無須人為地為數(shù)據(jù)打上標(biāo)簽。不同之處是,強(qiáng)化學(xué)習(xí)在特定數(shù)據(jù)集的情況下,通過選擇一系列的活動,學(xué)習(xí)獲取最大化收益。所以這里比較重要的就是如何最大化預(yù)期目標(biāo)(回報(bào)函數(shù))。

而為了更深入地理解這個(gè)問題,同時(shí)解決這個(gè)問題,我們需要知道什么是學(xué)習(xí)。學(xué)習(xí)的本質(zhì),用一個(gè)成語可概括為舉一反三。

以高考為例,高考的題目在上考場前我們未必做過,但在高中三年我們做過很多題目,懂解題方法,因此在考場上面對陌生問題也可以算出答案。機(jī)器學(xué)習(xí)的思路與此類似:利用一些訓(xùn)練數(shù)據(jù)(已經(jīng)做過的題),使機(jī)器能夠通過學(xué)習(xí)掌握數(shù)據(jù)規(guī)律(解題方法),從而分析未知數(shù)據(jù)(高考的題目)。

最簡單也最普遍的一類機(jī)器學(xué)習(xí)算法就是分類。對于分類,輸入的訓(xùn)練數(shù)據(jù)有特征、有標(biāo)簽。所謂的學(xué)習(xí),其本質(zhì)就是找到特征和標(biāo)簽之間的關(guān)系。因此當(dāng)有特征無標(biāo)簽的未知數(shù)據(jù)輸入時(shí),我們就可以通過已有的關(guān)系得到未知數(shù)據(jù)的標(biāo)簽。

在上述分類過程中,如果所有訓(xùn)練數(shù)據(jù)都有標(biāo)簽,則為監(jiān)督學(xué)習(xí)。如果所有訓(xùn)練數(shù)據(jù)沒有標(biāo)簽,則為無監(jiān)督學(xué)習(xí),即聚類。但需要注意的一點(diǎn)是,監(jiān)督學(xué)習(xí)算法并非全是分類,還有回歸。

目前分類的效果普遍還是不錯(cuò)的,但是相對來講,聚類就有些慘不忍睹了。本質(zhì)原因就是,無監(jiān)督學(xué)習(xí)本身的特點(diǎn)使其難以得到如分類一樣近乎完美的結(jié)果。這也正如我們做題一樣,答案(標(biāo)簽)是非常重要的,假設(shè)兩個(gè)完全相同的人同時(shí)進(jìn)入高中,一個(gè)正常學(xué)習(xí),另一個(gè)做的所有題目都沒有答案,那么高考時(shí)第一個(gè)人會比第二個(gè)人發(fā)揮得好。

這時(shí)各位可能要問,既然分類如此好,聚類如此不靠譜,那為何我們還要容忍聚類的存在?因?yàn)樵趯?shí)際應(yīng)用中,標(biāo)簽的獲取常常需要極大的人工工作量,有時(shí)甚至非常困難。困難到什么程度呢?例如,在自然語言處理(NLP)中,Penn Chinese Treebank組織在兩年里只完成了4000句話的標(biāo)簽標(biāo)記。

這時(shí)有人可能會想,難道監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)就是非黑即白的關(guān)系嗎?有沒有灰呢?灰是存在的。所謂的灰,也就是黑和白的中間地帶,即半監(jiān)督學(xué)習(xí)。對于半監(jiān)督學(xué)習(xí),其一部分訓(xùn)練數(shù)據(jù)是有標(biāo)簽的,另一部分訓(xùn)練數(shù)據(jù)是沒有標(biāo)簽的,而沒有標(biāo)簽的訓(xùn)練數(shù)據(jù)的數(shù)量常常大于有標(biāo)簽的訓(xùn)練數(shù)據(jù)的數(shù)量(這也是符合現(xiàn)實(shí)情況的)。隱藏在半監(jiān)督學(xué)習(xí)下的基本規(guī)律是:數(shù)據(jù)的分布不是完全隨機(jī)的,通過一些有標(biāo)簽的訓(xùn)練數(shù)據(jù)的局部特征,以及更多沒有標(biāo)簽的訓(xùn)練數(shù)據(jù)的整體分布,就能得到可以接受甚至非常好的分類結(jié)果。

綜上所述,深度學(xué)習(xí)的大致分類如表1-1所示。

表1-1 深度學(xué)習(xí)的大致分類

主站蜘蛛池模板: 鱼台县| 庆元县| 南雄市| 化德县| 永寿县| 监利县| 上虞市| 塘沽区| 十堰市| 金门县| 博野县| 额济纳旗| 绥阳县| 措美县| 淮北市| 黎平县| 弥渡县| 凤凰县| 黄冈市| 麻城市| 永定县| 宁德市| 长沙县| 宁阳县| 大港区| 泰和县| 广元市| 太原市| 定安县| 宁城县| 正镶白旗| 禹州市| 泰州市| 勐海县| 鹤庆县| 巴青县| 隆安县| 云阳县| 连平县| 平泉县| 乌鲁木齐市|