- 機(jī)器學(xué)習(xí):使用OpenCV、Python和scikit-learn進(jìn)行智能圖像處理(原書(shū)第2版)
- (印)阿迪蒂亞·夏爾馬 維什韋什·拉維·什里馬利 (美)邁克爾·貝耶勒
- 1216字
- 2020-11-24 18:12:54
1.2 開(kāi)始機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)已經(jīng)存在至少60年了。早期機(jī)器學(xué)習(xí)系統(tǒng)源于對(duì)人工智能的探索,推導(dǎo)出if…else語(yǔ)句的手工編碼規(guī)則來(lái)處理數(shù)據(jù)并做出決策。考慮一個(gè)垃圾郵件過(guò)濾器,其工作是解析收到的電子郵件,并將無(wú)用的郵件移入垃圾郵件文件夾,如圖1-1所示。

圖1-1 垃圾郵件過(guò)濾器處理過(guò)程
我們可以列出一個(gè)單詞黑名單,只要在一封郵件中出現(xiàn)這些黑名單中的單詞,就將該郵件標(biāo)記為垃圾郵件。這是手工編碼專(zhuān)家系統(tǒng)的一個(gè)簡(jiǎn)單示例。(我們將在第7章中構(gòu)建一個(gè)更加智能的垃圾郵件過(guò)濾器。)
如果允許我們將這些專(zhuān)家決策規(guī)則組合并嵌套到一棵決策樹(shù)中,那么這些專(zhuān)家決策規(guī)則可能會(huì)變得更加復(fù)雜(第5章)。接下來(lái),通過(guò)一系列決策步驟,我們就可以做出更明智的決策。你應(yīng)該注意到,盡管決策樹(shù)看起來(lái)像是一組if…else條件,但是它遠(yuǎn)不止于此,實(shí)際上這是一種機(jī)器學(xué)習(xí)算法,我們將在第5章中進(jìn)行探討。
手工編碼這些決策規(guī)則有時(shí)是可行的,但有兩個(gè)主要的缺點(diǎn):
- 做出一個(gè)決策所需的邏輯僅適用于單個(gè)域中的一個(gè)特定任務(wù)。例如,我們無(wú)法使用這個(gè)垃圾郵件過(guò)濾器在一張圖片中標(biāo)記我們的朋友。即使我們想要改變垃圾郵件過(guò)濾器來(lái)做一些稍微不同的事情,例如:過(guò)濾釣魚(yú)郵件(目的是盜取你的個(gè)人數(shù)據(jù)),我們也必須重新設(shè)計(jì)所有的決策規(guī)則。
- 手動(dòng)設(shè)計(jì)規(guī)則需要對(duì)問(wèn)題有一個(gè)深刻的理解。我們必須確切地知道什么類(lèi)型的電子郵件構(gòu)成了垃圾郵件,包括所有可能的例外。這并不像看上去那么容易,否則,我們就不會(huì)經(jīng)常反復(fù)查看我們的垃圾郵件文件夾,尋找意外過(guò)濾掉的重要郵件了。對(duì)于其他領(lǐng)域的問(wèn)題,手工設(shè)計(jì)規(guī)則簡(jiǎn)直是不可能的。
這就是機(jī)器學(xué)習(xí)的用武之地。有時(shí),我們不能很好地定義任務(wù)——除非通過(guò)例子——我們希望機(jī)器能夠自己理解并解決這些任務(wù)。在其他時(shí)候,重要的關(guān)系和相關(guān)性可能隱藏在我們?nèi)祟?lèi)會(huì)忽略的大數(shù)據(jù)中(見(jiàn)第8章)。在處理大數(shù)據(jù)時(shí),機(jī)器學(xué)習(xí)通常可以用來(lái)找出這些隱藏關(guān)系(也稱(chēng)為數(shù)據(jù)挖掘)。
人工專(zhuān)家系統(tǒng)失敗的一個(gè)很好的例子是檢測(cè)圖像中的臉。這么愚蠢,真的嗎?如今,每一部智能手機(jī)都能夠檢測(cè)圖像中的臉。可是,在20年前,這個(gè)問(wèn)題基本上還沒(méi)有解決。原因是,人們對(duì)臉部構(gòu)成要素的認(rèn)識(shí)對(duì)機(jī)器沒(méi)有太大的幫助。我們并不用像素來(lái)思考問(wèn)題。如果要我們來(lái)檢測(cè)一張臉,那么我們可能只會(huì)尋找一張臉的決定性特征,例如:眼睛、鼻子、嘴巴等。可是,當(dāng)所有的機(jī)器只知道圖像有像素,像素有一定的灰度時(shí),我們?nèi)绾胃嬖V一臺(tái)機(jī)器去尋找什么呢?在很長(zhǎng)的一段時(shí)間里,這種圖像表征上的差異基本上使人們無(wú)法提出一套好的決策規(guī)則,讓一臺(tái)機(jī)器檢測(cè)出圖像中的一張臉。我們將在第4章中討論解決這個(gè)問(wèn)題的各種方法。
然而,隨著卷積神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的出現(xiàn)(第9章),在識(shí)別臉部方面,機(jī)器已經(jīng)和我們?nèi)祟?lèi)一樣成功了。我們所要做的僅僅是向機(jī)器呈現(xiàn)大量臉部圖像集。大多數(shù)方法還需要對(duì)訓(xùn)練數(shù)據(jù)中臉部的位置進(jìn)行某種形式的標(biāo)注。從這時(shí)起,機(jī)器就能夠發(fā)現(xiàn)可以識(shí)別一張臉的特征集,而不必像人類(lèi)一樣來(lái)處理這個(gè)問(wèn)題了。這就是機(jī)器學(xué)習(xí)的真正強(qiáng)大之處。
- 剪映:剪輯+調(diào)色+字幕+配音+特效從新手到高手
- VR+:融合與創(chuàng)新
- 3ds Max/VRay印象 商業(yè)大空間效果圖表現(xiàn)技法(第2版)
- 攝影后期與短視頻剪輯零基礎(chǔ)一本通
- 零度莊園:3ds Max&VRay流水別墅表現(xiàn)藝術(shù)
- AutoCAD+3ds Max+Photoshop室內(nèi)設(shè)計(jì)效果圖制作藝術(shù)
- Photoshop CS5圖像處理
- 48小時(shí)精通Dreamweaver CS6
- 中文版AutoCAD 2010快捷命令一冊(cè)通
- 數(shù)碼攝影后期密碼Photoshop CS6光影神話
- Maya角色動(dòng)畫(huà)規(guī)律及設(shè)定(第3版)
- Kinect應(yīng)用開(kāi)發(fā)實(shí)戰(zhàn):用最自然的方式與機(jī)器對(duì)話
- 短視頻制作/拍攝/錄音從入門(mén)到精通
- Photoshop圖像處理傻瓜書(shū)(第二版)
- FFmpeg音視頻開(kāi)發(fā)基礎(chǔ)與實(shí)戰(zhàn)