官术网_书友最值得收藏!

1 神經(jīng)網(wǎng)絡(luò)是個什么東西

時間進入2014年,我們在各種媒體上看到與大數(shù)據(jù)和人工智能相關(guān)的新聞,其中炒得最熱的是深度學習,深度學習是什么?神經(jīng)網(wǎng)絡(luò)跟深度學習是什么關(guān)系?我們帶著這樣的疑問來看如下事例。

1.1 買橙子和機器學習

有一天,你到水果店去買橙子,當然要挑選最甜、最熟的。你是根據(jù)橙子的重量來付錢的,而不是根據(jù)橙子的甜度或者成熟度,雖然水果店有時候會把好的橙子挑出一堆單獨漲價,但是這里沒這么做。

你媽媽曾經(jīng)告訴你,橙子要挑深橙色的,顏色有點發(fā)紅的,這樣的橙子最甜,不要挑那些淺黃色甚至發(fā)青的,那些還沒熟透。

這樣你就有了一點經(jīng)驗,雖然這點經(jīng)驗是別人直接教給你的,但你也可以在挑選的時候用上:深橙色的橙子熟透了,甜。你在水果店,挑了些深橙色的橙子,稱重付錢回家了。這事就這么完了?別急,還有下文。

小事兒也沒那么簡單。

你回到家,高高興興吃橙子,但是你發(fā)現(xiàn)并不是每個橙子都那么甜,有一些還是不夠甜。看來媽媽的經(jīng)驗還是不足,只通過顏色判斷橙子甜不甜,不是很靠譜。

你開始回憶自己吃過的橙子。到底什么樣子的橙子最甜?好像是個頭大而且是深橙色的比較甜,那些個頭小的深橙色的橙子,大概有一半是不甜的。(比如,買了100個深橙色的橙子,有50個大的,都是甜的;另外50個小的,其中有25個是不甜的。)

你總算總結(jié)出了一條經(jīng)驗規(guī)則:大的深橙色的橙子是最甜的,哈哈。你又高高興興地去買橙子。可你熟悉的那種橙子賣完了,現(xiàn)在賣的是另一個品種,產(chǎn)自不同的地方,你之前總結(jié)的經(jīng)驗可能行不通了。你不知道之前的經(jīng)驗?zāi)懿荒苓w移過去(遷移學習),于是你重新嘗試,把各種橙子買回家嘗,幾次之后你發(fā)現(xiàn)這個品種中小的、淺黃色的橙子是最甜的!

過了幾天,表妹來你家玩,她想吃橙子,于是你們一起去買。她不在乎橙子甜不甜,只要多汁就好。唉,從前總結(jié)的經(jīng)驗又不管用了。你只能開始新的一輪實驗,目標就是多汁的橙子(優(yōu)化目標變了)。你又總結(jié)出,捏起來越有彈性的橙子汁越多。

后來,你出國讀書,國外的橙子跟你家鄉(xiāng)賣的又不一樣了,這里果蒂小、皮細膩的最好吃。畢業(yè)后,你結(jié)婚了,老婆不喜歡吃橙子,喜歡吃香蕉。生活是兩個人的事情,從現(xiàn)在開始,你不光要買橙子,還要買香蕉!你積累的挑選橙子的經(jīng)驗規(guī)則都行不通了。你只能從頭開始新的實驗嘗試,雖然這個過程很枯燥,但是你去做了,因為你愛她。

1.1.1 規(guī)則列表

你想把如何挑選橙子、香蕉等這些水果的方法和經(jīng)驗用程序?qū)崿F(xiàn),這樣用計算機,甚至用你的手機攝像頭掃一下,就能自動挑選出很多好吃的水果。因為你積累了一些規(guī)則,可以這么實現(xiàn):

    if (color is deep orange  and size is big  and sold by favorite vendor):
    orange is sweet.
    if (flexible): orange is juicy.
    etc.

這些規(guī)則越來越多的話,特征之間的組合就越來越麻煩和復(fù)雜,管理和使用都很麻煩。寫程序?qū)崿F(xiàn)的時候,誰會笨到寫這么多If…Then,這個時候就涉及我們的下一個問題。

1.1.2 機器學習

機器學習算法是普通算法的進化,更加聰明和自動。現(xiàn)在,我們分析如何把選橙子的問題定義成標準的機器學習問題。

隨機選擇一個市場上的橙子,作為我們要研究的目標(Training Data)。你可以用一個表格描述橙子的屬性和類型的關(guān)系,每一行可以放一個橙子的數(shù)據(jù),包括橙子的各種物理屬性(Feature):顏色、大小、形狀、產(chǎn)地等,還有品嘗時橙子的屬性(Output Variables):甜度、成熟度、多汁度等。現(xiàn)在這就是一個多分類問題,或者是回歸問題,自動從數(shù)據(jù)中學習出特征與橙子類型的各種關(guān)系等。

如果用決策樹算法,那么這個模型的樣子就是你的規(guī)則庫。當然,你也可以使用其他模型,比如線性模型,這樣就是特征的線性組合了。

下次你去買水果,采集了一個橙子的各個指標特征,扔進你的模型,模型就會告訴你這個橙子的各種屬性。

甚至你選擇橙子的模型稍微變化下就可以選擇香蕉了,這就叫遷移學習。

甚至你的模型會隨著新的樣本、新橙子的種類,變得越來越好,越來越全面,增量學習。

……

這就是機器學習,大家有點感覺了嗎?

主站蜘蛛池模板: 稷山县| 广昌县| 章丘市| 昌乐县| 江阴市| 汝州市| 布尔津县| 丰城市| 鄯善县| 湖口县| 微博| 罗源县| 华池县| 锡林郭勒盟| 深圳市| 天水市| 景德镇市| 鹤山市| 宜州市| 丰都县| 加查县| 西和县| 霍林郭勒市| 南漳县| 太康县| 清涧县| 民权县| 铁力市| 沁源县| 四子王旗| 尉犁县| 田东县| 乌兰浩特市| 襄汾县| 遵义县| 抚州市| 白河县| 东阳市| 平塘县| 延吉市| 峨眉山市|