官术网_书友最值得收藏!

機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)這個(gè)概念你可能聽說過,它與另外一個(gè)經(jīng)常被人們提及的詞——人工智能(AI)有關(guān)。人工智能經(jīng)常被描述為即將實(shí)現(xiàn)的科幻噩夢,但它與人類已知的最強(qiáng)大的計(jì)算機(jī)(你腦袋里的那個(gè)計(jì)算機(jī))比起來,只不過是滄海一粟。大腦的有意識(shí)思考、直覺與想象力讓它遠(yuǎn)遠(yuǎn)超過任何目前人為設(shè)計(jì)的計(jì)算機(jī)程序。在處理大量數(shù)據(jù)并識(shí)別其程序所要查找的趨勢與模式方面,算法具有極其強(qiáng)大的能力,但它也有著令人痛苦的局限性。

機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的一個(gè)分支。作為一個(gè)概念,它很簡單:你將大量數(shù)據(jù)輸入算法中,該算法可以學(xué)習(xí)或發(fā)現(xiàn)其中的模式,然后將這些模式應(yīng)用于它遇到的所有新信息。從理論上講,你輸入的數(shù)據(jù)越多,算法就能越好地理解和解釋未來出現(xiàn)的等效情境。

機(jī)器學(xué)習(xí)可以讓計(jì)算機(jī)分辨貓和狗的區(qū)別,研究疾病的性質(zhì),或者估算出一個(gè)家庭(甚至整個(gè)國家電網(wǎng))在一定時(shí)期內(nèi)所需要的電量。更不用提它在智力上超越專業(yè)國際象棋與圍棋棋手方面的成就了。

這些算法就在我們身邊,它們負(fù)責(zé)處理海量數(shù)據(jù),做出所有決策,從奈飛(Netflix)接下來會(huì)為你推薦什么電影,到銀行何時(shí)認(rèn)為你受到了詐騙,以及哪些郵件會(huì)進(jìn)入你的垃圾郵件文件夾。

盡管這些基本的計(jì)算機(jī)程序遠(yuǎn)遠(yuǎn)不及人腦,但它們也能教我們?nèi)绾胃行У厥褂梦覀兊男闹怯?jì)算機(jī)。為了理解這一點(diǎn),讓我們來看看機(jī)器學(xué)習(xí)中最常見的兩種技術(shù):監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)。

監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)是指,你在頭腦中有一個(gè)特定的結(jié)果,然后編寫算法來實(shí)現(xiàn)這個(gè)結(jié)果。這有點(diǎn)像數(shù)學(xué)課本,你可以在課本后面找到答案,但棘手的是如何找到答案。這個(gè)學(xué)習(xí)是有監(jiān)督的,因?yàn)樽鳛槌绦騿T,你知道答案是什么。你面臨的挑戰(zhàn)是如何確保算法從各種各樣潛在的輸入信息中總能找出正確答案。

例如,你該如何確保自動(dòng)駕駛汽車上的算法始終能夠識(shí)別交通信號(hào)燈的紅色和綠色,或者識(shí)別路上的行人?你如何確保用于協(xié)助診斷和排查癌癥的算法能夠正確地識(shí)別腫瘤?

這就是分類(classification),監(jiān)督學(xué)習(xí)的主要用途之一。在這個(gè)過程中,你基本上是在嘗試讓算法正確地標(biāo)注某個(gè)事物,并證明算法能夠在各種現(xiàn)實(shí)環(huán)境中可靠地執(zhí)行這項(xiàng)任務(wù)(并且隨著時(shí)間的推移而改進(jìn)算法)。監(jiān)督學(xué)習(xí)產(chǎn)生的算法可以高效運(yùn)行,并能運(yùn)用于各種各樣的情境,但本質(zhì)上,這些算法不過是高速運(yùn)轉(zhuǎn)的分類與標(biāo)注機(jī)器,你用得越多,它們就越有效。

無監(jiān)督學(xué)習(xí)

相比之下,無監(jiān)督學(xué)習(xí)中并不存在對于結(jié)果的任何設(shè)想。我們并沒有讓算法尋求任何正確答案。相反,我們?yōu)樗惴ň幊淌亲屗幚頂?shù)據(jù)并識(shí)別其中的固有模式。比如,如果你有一組關(guān)于選民或客戶的特定數(shù)據(jù),希望了解他們的動(dòng)機(jī),那么你可以使用無監(jiān)督學(xué)習(xí)來檢測并呈現(xiàn)那些有助于解釋他們行為的數(shù)據(jù)趨勢。某個(gè)年齡段的人會(huì)在一定的時(shí)間、地點(diǎn)購物嗎?什么因素讓這個(gè)地區(qū)投票給那個(gè)政黨的人團(tuán)結(jié)在一起?

我的工作是探索免疫系統(tǒng)的細(xì)胞結(jié)構(gòu)。我在工作中使用無監(jiān)督學(xué)習(xí)來識(shí)別細(xì)胞群體中的模式。我一直在尋找模式,但不知道模式是什么、在哪里,因此采用無監(jiān)督的方法。

這就是聚類(clustering),也就是根據(jù)共同的特性與主題將數(shù)據(jù)分組,而不必按照原本的A類、B類或C類來為數(shù)據(jù)歸類。當(dāng)你知道自己想要探索哪些廣闊的領(lǐng)域,但不知道如何實(shí)現(xiàn)自己的目標(biāo),甚至不知道在大量可用數(shù)據(jù)中尋找什么的時(shí)候,這種方法是很有用的。當(dāng)你想讓數(shù)據(jù)顯示自己的結(jié)論,而不強(qiáng)加預(yù)定的結(jié)論時(shí),也適合采用聚類的方法。

主站蜘蛛池模板: 原阳县| 葫芦岛市| 青州市| 株洲县| 岑巩县| 元江| 资源县| 比如县| 高邑县| 绥棱县| 准格尔旗| 禹州市| 邳州市| 昌宁县| 雅江县| 成都市| 天峨县| 盐边县| 平定县| 潜江市| 舟曲县| 绩溪县| 赞皇县| 贵州省| 当涂县| 灵山县| 哈密市| 鄂托克旗| 公主岭市| 静宁县| 漳州市| 阿克| 衡水市| 三亚市| 四平市| 南江县| 苗栗县| 枞阳县| 马关县| 徐汇区| 昌邑市|