官术网_书友最值得收藏!

1.1.4 和人工智能相關(guān)的幾個(gè)重要概念

1.監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)的任務(wù)是學(xué)習(xí)一個(gè)模型,這個(gè)模型可以處理任意的一個(gè)輸入,并且針對(duì)每個(gè)輸入都可以映射輸出一個(gè)預(yù)測結(jié)果。這里模型就相當(dāng)于數(shù)學(xué)中一個(gè)函數(shù),輸入就相當(dāng)于數(shù)學(xué)中的X,而預(yù)測的結(jié)果就相當(dāng)于數(shù)學(xué)中的Y。對(duì)于每一個(gè)X,都可以通過一個(gè)映射函數(shù)映射出一個(gè)結(jié)果。

2.非監(jiān)督學(xué)習(xí)

非監(jiān)督學(xué)習(xí)是指直接對(duì)沒有標(biāo)記的訓(xùn)練數(shù)據(jù)進(jìn)行建模學(xué)習(xí)。注意,在這里的數(shù)據(jù)是沒有標(biāo)記的數(shù)據(jù),與監(jiān)督學(xué)習(xí)最基本的區(qū)別之一就是建模的數(shù)據(jù)是否有標(biāo)簽。例如聚類(將物理或抽象對(duì)象的集合分成由類似的對(duì)象組成的多個(gè)類的過程)就是一種典型的非監(jiān)督學(xué)習(xí),分類就是一種典型的監(jiān)督學(xué)習(xí)。

3.半監(jiān)督學(xué)習(xí)

當(dāng)有標(biāo)記的數(shù)據(jù)很少、未被標(biāo)記的數(shù)據(jù)很多,且人工標(biāo)記又比較昂貴時(shí),可以根據(jù)一些條件(查詢算法)查詢一些數(shù)據(jù),讓專家進(jìn)行標(biāo)記。這是半監(jiān)督學(xué)習(xí)與其他算法的本質(zhì)區(qū)別。所以說對(duì)主動(dòng)學(xué)習(xí)的研究主要是設(shè)計(jì)一種框架模型,運(yùn)用新的查詢算法查詢需要專家來人工標(biāo)注的數(shù)據(jù)。最后用查詢到的樣本訓(xùn)練分類模型來提高模型的精確度。

4.主動(dòng)學(xué)習(xí)

當(dāng)使用一些傳統(tǒng)的監(jiān)督學(xué)習(xí)方法做分類處理時(shí),通常是訓(xùn)練樣本的規(guī)模越大,分類的效果就越好。但是在現(xiàn)實(shí)中的很多場景中,標(biāo)記樣本的獲取是比較困難的,因?yàn)檫@需要領(lǐng)域內(nèi)的專家來進(jìn)行人工標(biāo)注,所花費(fèi)的時(shí)間成本和經(jīng)濟(jì)成本都很大。而且,如果訓(xùn)練樣本的規(guī)模過于龐大,則訓(xùn)練花費(fèi)的時(shí)間也會(huì)比較多。那么問題來了:有沒有一種有效辦法,能夠使用較少的訓(xùn)練樣本來獲得性能較好的分類器呢?答案是肯定的,主動(dòng)學(xué)習(xí)(Active Learning)提供了這種可能。主動(dòng)學(xué)習(xí)通過一定的算法查詢出最有用的未標(biāo)記樣本,并交由專家進(jìn)行標(biāo)記,然后用查詢到的樣本訓(xùn)練分類模型來提高模型的精確度。

在人類的學(xué)習(xí)過程中,通常利用已有的經(jīng)驗(yàn)來學(xué)習(xí)新的知識(shí),又依靠獲得的知識(shí)來總結(jié)和積累經(jīng)驗(yàn),經(jīng)驗(yàn)與知識(shí)不斷交互。同樣,機(jī)器學(xué)習(xí)就是模擬人類學(xué)習(xí)的過程,利用已有的知識(shí)訓(xùn)練出模型去獲取新的知識(shí),并通過不斷積累的信息去修正模型,以得到更加準(zhǔn)確有用的新模型。不同于被動(dòng)地接受知識(shí),主動(dòng)學(xué)習(xí)能夠有選擇性地獲取知識(shí)。

主站蜘蛛池模板: 万盛区| 高碑店市| 丰城市| 阿拉善右旗| 阿坝| 普洱| 富锦市| 北海市| 武义县| 石楼县| 武邑县| 满洲里市| 北碚区| 芮城县| 寿阳县| 山丹县| 威信县| 洪江市| 潼关县| 岳普湖县| 宁晋县| 日照市| 亚东县| 丹巴县| 绥中县| 桑日县| 阜康市| 北川| 彰化市| 黑山县| 惠东县| 吴忠市| 肥东县| 建阳市| 榕江县| 尼勒克县| 宜城市| 黔江区| 牙克石市| 沁水县| 大邑县|