官术网_书友最值得收藏!

3.1 什么是模型

在數(shù)學(xué)或科學(xué)中,模型一詞指的是一種規(guī)則或準(zhǔn)則,通常可以用數(shù)學(xué)或代碼來(lái)表達(dá),它有助于接受輸入并對(duì)世界未來(lái)可能的工作方式做出預(yù)測(cè)。例如,這里有一個(gè)你可能認(rèn)識(shí)的著名模型:

E=mc

這是一個(gè)非常可愛(ài)的模型,它告訴你,如果你把給定數(shù)值的質(zhì)量(m)轉(zhuǎn)換成超高溫和爆炸性的東西,你可能會(huì)得到多少能量(E),常數(shù)c2告訴你,即使是一點(diǎn)點(diǎn)的m也能得到相當(dāng)多的E。這個(gè)模型是由一個(gè)聰明人經(jīng)過(guò)長(zhǎng)時(shí)間的深思熟慮創(chuàng)造的,并在各種環(huán)境中都表現(xiàn)出色。它不需要大量的維護(hù),并能很好地應(yīng)用于各種環(huán)境中,甚至是那些最初創(chuàng)建時(shí)從未設(shè)想過(guò)的環(huán)境。

我們通常在機(jī)器學(xué)習(xí)中處理的模型在某些方面是相似的。它們接受輸入并使用以數(shù)學(xué)符號(hào)或代碼表達(dá)的規(guī)則給出輸出,通常被認(rèn)為是預(yù)測(cè)。這些預(yù)測(cè)可以代表物理世界,比如“西雅圖明天下雨的概率是多少?”或者可以代表數(shù)量,比如“下個(gè)月我們的網(wǎng)站yarnit.ai會(huì)賣出多少單位的毛線?”或者甚至可以代表抽象的人類概念,比如“這張圖片對(duì)用戶來(lái)說(shuō)是否具有美感?”

關(guān)鍵的區(qū)別是,無(wú)論我們多么聰明,通常用于機(jī)器學(xué)習(xí)的模型都是我們無(wú)法用E=mc2這樣簡(jiǎn)潔清晰的規(guī)則寫(xiě)下的模型。在許多信息(通常稱為特征)都需要以人類難以事先指定的方式加以考慮的情況下,我們轉(zhuǎn)向了機(jī)器學(xué)習(xí)。一些可以作為特征處理的數(shù)據(jù)的例子是來(lái)自數(shù)千個(gè)地點(diǎn)的大氣讀數(shù),也就是圖像中數(shù)千個(gè)像素的顏色值,或者最近訪問(wèn)過(guò)一家在線商店的所有用戶的購(gòu)買歷史。當(dāng)處理來(lái)源如此復(fù)雜的信息時(shí)——遠(yuǎn)不止一個(gè)質(zhì)量值和一個(gè)比例常數(shù)——人類專家通常不可能或很難利用全部可用的信息來(lái)創(chuàng)建和驗(yàn)證可靠的模型。在這些情況下,我們轉(zhuǎn)而使用以前觀察到的大量數(shù)據(jù)。在使用數(shù)據(jù)來(lái)訓(xùn)練模型時(shí),我們希望所生成的模型既能很好地適應(yīng)過(guò)去的數(shù)據(jù),又能對(duì)未來(lái)新的、以前未見(jiàn)過(guò)的數(shù)據(jù)進(jìn)行概括性的預(yù)測(cè)。

主站蜘蛛池模板: 奉化市| 伊吾县| 鄂托克前旗| 湘阴县| 古浪县| 沁阳市| 台东市| 高安市| 玛多县| 常山县| 平武县| 讷河市| 万州区| 门源| 莲花县| 宁城县| 黄骅市| 旌德县| 安陆市| 勐海县| 胶州市| 黔江区| 阿勒泰市| 隆回县| 乐业县| 商洛市| 荃湾区| 中宁县| 米泉市| 资兴市| 苍溪县| 邹平县| 安图县| 宣武区| 雅江县| 桐梓县| 丹棱县| 尚义县| 隆安县| 翼城县| 安西县|