官术网_书友最值得收藏!

2.1 人工智能、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)

近年來(lái),深度學(xué)習(xí)的概念十分火熱,人工智能也由于這一技術(shù)的興起吸引了越來(lái)越多的關(guān)注。我們將結(jié)合一些基本的用例,簡(jiǎn)要介紹一下這個(gè)新的技術(shù)。

首先需要明確人工智能、機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)三者之間的關(guān)系,如圖2-1所示。如NVIDIA官網(wǎng)文章所述,人工智能是一個(gè)非常大的概念,而機(jī)器學(xué)習(xí)只是人工智能的一種實(shí)現(xiàn)方法。深度學(xué)習(xí)同樣也是一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的方法,是在機(jī)器學(xué)習(xí)的基礎(chǔ)上建立起來(lái)的。首先,從字面上看,二者都是在“學(xué)習(xí)”,因此在評(píng)價(jià)深度學(xué)習(xí)訓(xùn)練出的模型好壞時(shí),同樣直接來(lái)源于機(jī)器學(xué)習(xí)的評(píng)價(jià)方法。其次,深度學(xué)習(xí)最基本的形式是深度神經(jīng)網(wǎng)絡(luò),直接脫胎于機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)模型。

圖2-1 人工智能、機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)三者之間的關(guān)系

(圖片來(lái)源:https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/)

正是由于深度學(xué)習(xí)直接脫胎于機(jī)器學(xué)習(xí)理論,因此本書(shū)將首先介紹一些基本的機(jī)器學(xué)習(xí)知識(shí)。機(jī)器學(xué)習(xí)本身包含了很多內(nèi)容,如果對(duì)其進(jìn)行簡(jiǎn)單的分類(lèi)梳理,可以歸于以下幾類(lèi):

  • 非監(jiān)督學(xué)習(xí)
    •  聚類(lèi)
    •  降維
    •  ...
  • 監(jiān)督學(xué)習(xí)
    •  回歸問(wèn)題
    •  分類(lèi)問(wèn)題

單純講概念,可能看起來(lái)有些枯燥,我們不妨把機(jī)器學(xué)習(xí)和人類(lèi)的學(xué)習(xí)行為類(lèi)比一下。監(jiān)督學(xué)習(xí)相比非監(jiān)督學(xué)習(xí)最大的區(qū)別是,這種方法有明確的評(píng)價(jià)指標(biāo),這種指標(biāo)類(lèi)似學(xué)校里的考試成績(jī),我們可以簡(jiǎn)單地認(rèn)為考試成績(jī)高,這個(gè)學(xué)生就是好學(xué)生。對(duì)于機(jī)器而言,就是機(jī)器訓(xùn)練的模型在給定的數(shù)據(jù)集中,預(yù)測(cè)準(zhǔn)確率高,這個(gè)模型就是一個(gè)好模型。因此我們不妨認(rèn)為監(jiān)督學(xué)習(xí)就是一種唯分?jǐn)?shù)論的應(yīng)試教育方法,參見(jiàn)表2-1。

表2-1 監(jiān)督模型

有應(yīng)試教育,就有素質(zhì)教育。素質(zhì)教育并非沒(méi)有評(píng)價(jià)標(biāo)準(zhǔn),但是相比應(yīng)試教育要寬松很多,在考察過(guò)程中,手里可以有更多的主觀因素。這一點(diǎn)在非監(jiān)督學(xué)習(xí)中同樣成立。如一句古話所言,“近朱者赤,近墨者黑”,要評(píng)價(jià)一個(gè)人如何,就看他平時(shí)和什么樣的人在一起。非監(jiān)督學(xué)習(xí)中的各種聚類(lèi)方法,同樣使用了這種思想,就是并不直接評(píng)價(jià)某一個(gè)體,而是看個(gè)體之間的接近程度,將眾多個(gè)體歸為少數(shù)幾個(gè)群體,再基于這個(gè)群體的特征進(jìn)行簡(jiǎn)要概括。

試卷中有主觀題和客觀題,我們用來(lái)類(lèi)比的監(jiān)督學(xué)習(xí)同樣可以分為這兩種。我們知道主觀題的答案,如語(yǔ)文閱讀、政治歷史問(wèn)答題,是不要求跟標(biāo)準(zhǔn)答案完全一致的,其評(píng)價(jià)標(biāo)準(zhǔn)也是越接近越好;這一點(diǎn)就類(lèi)似機(jī)器學(xué)習(xí)的回歸問(wèn)題,比如用模型預(yù)測(cè)房?jī)r(jià)、股市走勢(shì),大致預(yù)測(cè)出價(jià)格趨勢(shì)就非常了不起了,不可能圓、角、分全部正確才認(rèn)為預(yù)測(cè)正確,差一分就預(yù)測(cè)錯(cuò)誤。而簡(jiǎn)單的客觀題,如判斷題、單項(xiàng)選擇題,只有固定數(shù)目選項(xiàng),必須和標(biāo)準(zhǔn)答案完全一致才算正確的,這一點(diǎn)類(lèi)似于機(jī)器學(xué)習(xí)的分類(lèi)問(wèn)題,比如預(yù)測(cè)一個(gè)人是否患有某種疾病,有就是有,沒(méi)有就是沒(méi)有。

注意,這里有一個(gè)誤區(qū),即認(rèn)為素質(zhì)教育優(yōu)于應(yīng)試教育。現(xiàn)在機(jī)器學(xué)習(xí)領(lǐng)域中的吳恩達(dá)等學(xué)者也一再?gòu)?qiáng)調(diào)非監(jiān)督算法的重要意義,實(shí)際上拿到一個(gè)學(xué)習(xí)任務(wù)后,具體使用哪一種方式去分析還是需要考慮應(yīng)用場(chǎng)景的。通常我們不了解這個(gè)學(xué)習(xí)任務(wù)的目的性、需要找線索時(shí),會(huì)用非監(jiān)督找線索,包括聚類(lèi)、降維方法等。如果明確了學(xué)習(xí)的目的性,追求高準(zhǔn)確率,就需要使用監(jiān)督學(xué)習(xí)的方法了。

由于本書(shū)是入門(mén)讀物,并且希望給讀者帶來(lái)快速上手的體驗(yàn),因此我們將在接下來(lái)的過(guò)程中主要介紹監(jiān)督學(xué)習(xí)的分類(lèi)部分。

主站蜘蛛池模板: 岐山县| 石嘴山市| 天台县| 临城县| 伊春市| 博白县| 定日县| 马公市| 晋州市| 大名县| 集贤县| 胶南市| 禹城市| 舟山市| 铁岭县| 盐池县| 东至县| 平舆县| 舒兰市| 香港 | 石景山区| 湘阴县| 察哈| 平凉市| 班戈县| 旅游| 页游| 大余县| 宝坻区| 武冈市| 普安县| 安溪县| 城步| 九龙坡区| 西青区| 广昌县| 威远县| 山西省| 游戏| 连城县| 鹤山市|