書(shū)名: 人工智能基礎(chǔ)作者名: 周穎 鄭文明 徐衛(wèi) 趙力編著本章字?jǐn)?shù): 1303字更新時(shí)間: 2020-09-18 18:21:24
1.3 人工智能與機(jī)器學(xué)習(xí)的關(guān)系
計(jì)算機(jī)要像人類一樣完成更多智能的工作,需要掌握關(guān)于這個(gè)世界海量的知識(shí)。比如,要實(shí)現(xiàn)汽車自動(dòng)駕駛,計(jì)算機(jī)至少需要能夠判斷哪里是路,哪里是障礙物,這個(gè)對(duì)人非常直觀的東西,對(duì)計(jì)算機(jī)卻是相當(dāng)困難的。路有水泥的、瀝青的,也有石子的甚至土路。這些不同材質(zhì)鋪成的路在計(jì)算機(jī)看來(lái)差距非常大。如何讓計(jì)算機(jī)掌握這些人類看起來(lái)非常直觀的常識(shí),對(duì)于人工智能的發(fā)展是一個(gè)巨大的挑戰(zhàn)。很多早期的人工智能系統(tǒng)只能成功應(yīng)用于相對(duì)特定的環(huán)境(specific domain),在這些特定環(huán)境下,計(jì)算機(jī)需要了解的知識(shí)很容易被嚴(yán)格并且完整地定義。例如,IBM研發(fā)的計(jì)算機(jī)“深藍(lán)”(Deep Blue)在1997年打敗了國(guó)際象棋冠軍卡斯帕羅夫。設(shè)計(jì)出下象棋軟件是人工智能史上的重大成就,但其主要挑戰(zhàn)不在于讓計(jì)算機(jī)掌握國(guó)際象棋中的規(guī)則。國(guó)際象棋是一個(gè)特定的環(huán)境,在這個(gè)環(huán)境中,計(jì)算機(jī)只需要了解每一個(gè)棋子規(guī)定的行動(dòng)范圍和行動(dòng)方法即可。雖然計(jì)算機(jī)早在1997年就可以擊敗國(guó)際象棋的世界冠軍,但是直到20年后的今天,讓計(jì)算機(jī)實(shí)現(xiàn)大部分成年人都可以完成的汽車駕駛卻仍然依舊十分困難。
如何讓計(jì)算機(jī)可以跟人類一樣從歷史的經(jīng)驗(yàn)中獲取新的知識(shí)呢?這就是機(jī)器學(xué)習(xí)需要解決的問(wèn)題。卡內(nèi)基梅隆大學(xué)的Tom Mitchell教授在1997年出版的書(shū)籍《機(jī)器學(xué)習(xí)》(Machine Learning)中對(duì)機(jī)器學(xué)習(xí)進(jìn)行了非常專業(yè)的定義:“如果一個(gè)程序可以在任務(wù)T上,隨著經(jīng)驗(yàn)E的增加,效果P也可以隨之增加,則稱這個(gè)程序可以從經(jīng)驗(yàn)中學(xué)習(xí)”。學(xué)習(xí)是人類智能的重要特征,是獲得知識(shí)的基本手段,而機(jī)器學(xué)習(xí)也是使計(jì)算機(jī)具有智能的根本途徑,如香克(Shank)所說(shuō):“一臺(tái)計(jì)算機(jī)若不會(huì)學(xué)習(xí),就不能稱為具有智能的。”除此之外,機(jī)器學(xué)習(xí)還有助于發(fā)現(xiàn)人類學(xué)習(xí)的機(jī)理和揭示人腦的奧秘。
機(jī)器學(xué)習(xí)大致可以分為以下步驟:數(shù)據(jù)采集、特征提取、特征組合評(píng)價(jià)、現(xiàn)狀態(tài)與特征組合匹配。每一步驟都在整個(gè)學(xué)習(xí)過(guò)程充當(dāng)重要的角色,對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō),數(shù)據(jù)采集要達(dá)到一定的量,數(shù)據(jù)量太小會(huì)失去研究的意義,通常機(jī)器學(xué)習(xí)的數(shù)據(jù)采集需要交代數(shù)據(jù)的來(lái)源以及采集方式,不同的數(shù)據(jù)采集的困難程度不同。
特征選取與特征提取的關(guān)鍵區(qū)別在于:特征選取是從原特征集中選取一個(gè)子特征集,而特征提取則是在原特征集的基礎(chǔ)上重新構(gòu)造出一些(一個(gè)或多個(gè))全新的特征。特征提取是決定整個(gè)機(jī)器學(xué)習(xí)的關(guān)鍵一步,一般來(lái)說(shuō)數(shù)據(jù)都會(huì)經(jīng)過(guò)一定的處理再進(jìn)行機(jī)器學(xué)習(xí),原始數(shù)據(jù)的計(jì)算量過(guò)于龐大,因此必須經(jīng)過(guò)特征提取,特征提取的結(jié)果從根本上決定著機(jī)器學(xué)習(xí)的結(jié)果。不同學(xué)者對(duì)于特征設(shè)計(jì)有著不同的定義,但是好的特征變量都需要考慮到以下特性:第一,要盡可能地相對(duì)獨(dú)立,以免影響到后面的計(jì)算量;第二,整個(gè)特征集合要盡可能形成一個(gè)完備的描述空間,即一個(gè)盡可能完備的描述空間下的特征,其能通過(guò)機(jī)器學(xué)習(xí)所提取信息的效率才能最大化;第三,在進(jìn)行特征設(shè)計(jì)時(shí)要考慮到執(zhí)行效率。
特征組合評(píng)價(jià)、現(xiàn)狀態(tài)與特征組合匹配屬于機(jī)器學(xué)習(xí)的核心部分,如果不能在特征上處理好計(jì)算量的問(wèn)題,就需要設(shè)計(jì)更好的算法加快收斂速度。
總地來(lái)說(shuō),人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是非常相關(guān)的幾個(gè)領(lǐng)域。圖1-5總結(jié)了它們之間的關(guān)系。人工智能是一類非常廣泛的問(wèn)題,機(jī)器學(xué)習(xí)是解決這類問(wèn)題的一個(gè)重要手段。

圖1-5 人工智能與機(jī)器學(xué)習(xí)的關(guān)系
- 漢語(yǔ)歷史詞匯學(xué)概要
- 好讀書(shū)而求甚解:葉圣陶談閱讀
- 新編常用公文寫(xiě)作范本全書(shū):文書(shū)釋義、格式模板、文書(shū)范本、寫(xiě)作技巧、場(chǎng)景案例、應(yīng)用提示(3版)
- 漢語(yǔ)告知范疇研究
- 中國(guó)傳統(tǒng)文化啟蒙仿古讀本:三字經(jīng)
- 古文字研究(第三十四輯)
- 寫(xiě)作教學(xué)密碼:鄧彤老師品評(píng)寫(xiě)作課
- 基于綜合性句法—語(yǔ)義界面的中動(dòng)結(jié)構(gòu)研究
- 基于注疏文獻(xiàn)的《孟子》信息處理研究
- 口才與應(yīng)用寫(xiě)作
- 全國(guó)外語(yǔ)翻譯證書(shū)考試必備:口譯句型強(qiáng)化
- 全球化、英語(yǔ)傳播與中國(guó)的語(yǔ)言規(guī)劃研究
- 新媒體寫(xiě)作:從提筆就怕到成就IP
- 基于語(yǔ)料庫(kù)的程式語(yǔ)的系統(tǒng)、功能與結(jié)構(gòu)研究
- 漢語(yǔ)簡(jiǎn)單反身代詞回指的神經(jīng)認(rèn)知研究