官术网_书友最值得收藏!

1.1 ML涉及的概念

通常認(rèn)為ML是計(jì)算機(jī)科學(xué)疊加數(shù)學(xué)學(xué)科的一個(gè)子領(lǐng)域,它關(guān)注的是建立一些有用的算法,關(guān)于它的起源可以追溯到20世紀(jì)50年代,當(dāng)時(shí)一些研究人員開始探索計(jì)算機(jī)是否可以學(xué)習(xí)、思考和推理,并將ML定義為通過以下方式解決實(shí)際問題的過程。

● 將任務(wù)目標(biāo)轉(zhuǎn)化成一個(gè)統(tǒng)計(jì)模型。

● 通過某種方式從實(shí)際應(yīng)用交互中收集數(shù)據(jù),并根據(jù)模型目標(biāo)進(jìn)行一定的處理。

● 在數(shù)據(jù)集的基礎(chǔ)上,通過算法訓(xùn)練這個(gè)統(tǒng)計(jì)模型,假定該統(tǒng)計(jì)模型用于以某種方式解決實(shí)際問題。

用一句話總結(jié),ML是一門通過算法和統(tǒng)計(jì)模型從數(shù)據(jù)中學(xué)習(xí)知識(shí)的學(xué)科。為了敘述方便,本書中的“學(xué)習(xí)”和“機(jī)器學(xué)習(xí)”(即ML)可以互換使用。出于同樣的原因,“模型”也指的是“統(tǒng)計(jì)模型”。其中,ML可以是監(jiān)督的、半監(jiān)督的、無監(jiān)督的和強(qiáng)化的。

當(dāng)我們遇到的問題可以用一套可管理的確定性規(guī)則來解決時(shí),這類問題便不需要使用ML。所謂“可管理”是指有可以顯式表達(dá)的規(guī)則,且隨著數(shù)據(jù)的變化并不需要變更規(guī)則。那么問題來了,哪些任務(wù)可以且應(yīng)該由ML來解決呢?在我們的實(shí)際業(yè)務(wù)中,首先考慮從具體的業(yè)務(wù)角度確定是否需要ML,然后努力尋找可能可以解決該類問題的ML方法并進(jìn)行快速迭代。我們將在本節(jié)中介紹這個(gè)過程,首先介紹哪些任務(wù)能夠通過ML解決,哪些ML方法適合哪些產(chǎn)品目標(biāo),以及如何處理數(shù)據(jù)需求。

在ML的工作模式里,一切皆是概率,它在不需要人類給予手把手指導(dǎo)的情況下處理任務(wù),這意味著ML可以比人類專家更適合處理一些復(fù)雜任務(wù),比如將數(shù)百萬篇文章推薦給數(shù)千萬人,從實(shí)操角度,我們可以通過以下兩個(gè)步驟來實(shí)現(xiàn)上述任務(wù)。

(1)將業(yè)務(wù)目標(biāo)框定在一個(gè)ML范式中。

(2)評(píng)估該ML任務(wù)的可行性,根據(jù)評(píng)估結(jié)果,重新調(diào)整ML框架和算法,直到獲取滿意的結(jié)果為止。

ML中有很多常用模型,我們?cè)诖瞬粚?duì)所有模型進(jìn)行概述。為了界定不同類別模型及判斷適用的實(shí)際問題,我們提出了一個(gè)簡(jiǎn)單的模型分類判別作為選擇處理特定ML問題的方法指南。ML可以根據(jù)是否需要標(biāo)簽來分類,標(biāo)簽指的是可以收集到的數(shù)據(jù)中存在的一個(gè)期望輸出,從這個(gè)維度出發(fā),我們可以把ML劃分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)從包含輸入及標(biāo)簽的數(shù)據(jù)集中學(xué)習(xí)由輸入到標(biāo)簽的映射關(guān)系;相對(duì)應(yīng)地,無監(jiān)督學(xué)習(xí)則不需要標(biāo)簽;弱監(jiān)督學(xué)習(xí)使用的數(shù)據(jù)集中只有部分?jǐn)?shù)據(jù)集含有標(biāo)簽。對(duì)于大多數(shù)應(yīng)用來說,監(jiān)督學(xué)習(xí)由于可以獲取到實(shí)際發(fā)生的標(biāo)簽,使得其預(yù)測(cè)性能更容易驗(yàn)證。具體地,需要先確定業(yè)務(wù)系統(tǒng)可以產(chǎn)生哪些數(shù)據(jù),目標(biāo)輸出是什么,然后界定哪些模型適合加工這類輸入和輸出,這將有助于大大縮小檢索ML方法的范圍。

1.1.1 監(jiān)督學(xué)習(xí)

在監(jiān)督學(xué)習(xí)中,數(shù)據(jù)科學(xué)家建模時(shí)使用的主要“素材”是一組含有標(biāo)簽的實(shí)例{(x1y1),(x2,y2),…,(xNyN)}。N個(gè)實(shí)例中的每個(gè)元素xi被稱為一個(gè)特征向量。在計(jì)算機(jī)科學(xué)中,向量是一個(gè)一維數(shù)組。一維數(shù)組又是一個(gè)有序的、有索引的值序列。假設(shè)每個(gè)特征向量的長度為D,即向量的維度,而yi表示上面說的輸出標(biāo)簽。

每個(gè)特征向量都是向量,長度(維度)為D的特征向量中從1到D的每個(gè)維度j都包含一個(gè)值,我們將每個(gè)這樣的值稱為一個(gè)特征,并記為x(j)。例如,如果我們收集的數(shù)據(jù)中x代表特征向量(假設(shè)收集的是某網(wǎng)站上用戶的數(shù)據(jù)),特征向量的第一個(gè)維度x(1)可以是以cm為單位的身高信息,特征向量的第二個(gè)維度x(2)可以是以kg為單位的體重信息,特征向量的第三個(gè)維度x(3)可以是性別信息,以此類推。需要注意的是,對(duì)于數(shù)據(jù)集中的所有實(shí)例,特征向量中位置j的特征對(duì)應(yīng)的類型是相同的。這意味著,如果第i個(gè)實(shí)例xi的第二個(gè)維度是以kg為單位的體重特征,則對(duì)于1到N個(gè)實(shí)例中的任意一個(gè)實(shí)例xk的第二個(gè)維度也是以kg為單位的體重特征。

在監(jiān)督學(xué)習(xí)中,預(yù)測(cè)輸出標(biāo)簽為有限的離散值的問題叫作分類;而預(yù)測(cè)輸出標(biāo)簽為連續(xù)實(shí)數(shù)的問題叫作回歸。其中,由監(jiān)督學(xué)習(xí)預(yù)測(cè)的標(biāo)簽值又被稱為目標(biāo)。在分類中,學(xué)習(xí)算法尋找的是一條線(或者更一般的說法,是尋找一個(gè)超平面),將不同類的實(shí)例彼此分開。在回歸中,學(xué)習(xí)算法尋找的是一條線或一個(gè)擬合訓(xùn)練實(shí)例的超平面,如圖1-1所示。

圖1-1 分類和回歸之間的區(qū)別

分類和回歸相似的原因之一是,大多數(shù)分類模型并不是直接預(yù)測(cè)輸入實(shí)例歸屬的類別,而是預(yù)測(cè)輸入實(shí)例歸屬某一類別的概率值。然后,最終的分類則歸結(jié)為根據(jù)所屬概率值排序及根據(jù)相關(guān)閾值來決定如何將一個(gè)實(shí)例歸入一個(gè)類別。因此,在一個(gè)高層次概念上,分類模型可以被看作對(duì)概率值的回歸。例如,如果你的業(yè)務(wù)問題是用戶流失預(yù)警,那么期望標(biāo)簽會(huì)有兩個(gè)類:正常用戶和流失用戶。該示例通常被歸為分類問題,而實(shí)際模型的處理上通常是預(yù)估給定用戶及特征的流失概率。

模型的設(shè)計(jì)一般會(huì)將問題抽象映射到典型的數(shù)學(xué)函數(shù),而在思考模型對(duì)輸入特征的作用時(shí),也可以方便地認(rèn)為模型“看”到了輸入中一些特征的值,并根據(jù)類似實(shí)例的經(jīng)驗(yàn)來輸出一個(gè)值。這個(gè)輸出值是一個(gè)數(shù)字或一個(gè)類,與過去在特征值相似的實(shí)例中看到的標(biāo)簽“最相似”。統(tǒng)計(jì)上,我們把這種最相似稱為極大似然,典型的如決策樹和k-最近鄰模型的工作原理也是如此。

1.1.2 無監(jiān)督學(xué)習(xí)

在無監(jiān)督學(xué)習(xí)中,數(shù)據(jù)集是一組未標(biāo)記的實(shí)例{x1,x2,…,xN}的集合。同樣,xi是一個(gè)特征向量,無監(jiān)督學(xué)習(xí)算法的目標(biāo)是創(chuàng)建一個(gè)模型,將特征向量xi作為輸入,并將其映射為一個(gè)向量或可用于解決實(shí)際問題的數(shù)值。例如,在聚類中,模型會(huì)返回?cái)?shù)據(jù)集中每個(gè)特征向量的聚類ID。聚類對(duì)于在圖像或文本文檔等大型對(duì)象集合中尋找相似對(duì)象的群體或者從大量樣本中尋找異常群體非常有用。

無監(jiān)督學(xué)習(xí)還有一個(gè)典型的應(yīng)用場(chǎng)景,即降維,該類方法通常處于一個(gè)ML項(xiàng)目的中間環(huán)節(jié),比如當(dāng)一個(gè)ML項(xiàng)目中涉及的特征維度非常大時(shí),基于模型訓(xùn)練和生產(chǎn)應(yīng)用性能的考慮,通常會(huì)在特征側(cè)先進(jìn)行降維,這個(gè)過程的結(jié)果會(huì)以一個(gè)子模型呈現(xiàn),此時(shí)模型的輸出是一個(gè)比輸入維度更小的特征向量。該降維模型的輸出會(huì)保留輸入的關(guān)鍵信息,但維度會(huì)小很多。

1.1.3 半監(jiān)督學(xué)習(xí)

在半監(jiān)督學(xué)習(xí)中,數(shù)據(jù)集同時(shí)包含有標(biāo)簽和無標(biāo)簽的實(shí)例。通常情況下,未標(biāo)注實(shí)例的數(shù)量遠(yuǎn)遠(yuǎn)多于已標(biāo)注實(shí)例的數(shù)量。半監(jiān)督學(xué)習(xí)的目標(biāo)和監(jiān)督學(xué)習(xí)的目標(biāo)是一樣的。半監(jiān)督學(xué)習(xí)的目標(biāo)是,通過使用若干未標(biāo)注實(shí)例和已標(biāo)注實(shí)例,找到(這個(gè)過程也叫擬合或訓(xùn)練)一個(gè)更佳的模型。

1.1.4 強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL),又稱再勵(lì)學(xué)習(xí)、評(píng)價(jià)學(xué)習(xí)或增強(qiáng)學(xué)習(xí),是機(jī)器學(xué)習(xí)的范式和方法論之一,用于描述和解決智能體(Agent)在與環(huán)境交互的過程中通過學(xué)習(xí)策略達(dá)成回報(bào)最大化或?qū)崿F(xiàn)特定目標(biāo)的問題。

強(qiáng)化學(xué)習(xí)的常見模型是標(biāo)準(zhǔn)的馬爾可夫決策過程(Markov Decision Process,MDP)。按給定條件進(jìn)行分類,強(qiáng)化學(xué)習(xí)可分為基于模型的強(qiáng)化學(xué)習(xí)(Model-Based RL)和無模型強(qiáng)化學(xué)習(xí)(Model-Free RL),以及主動(dòng)強(qiáng)化學(xué)習(xí)(Active RL)和被動(dòng)強(qiáng)化學(xué)習(xí)(Passive RL)。強(qiáng)化學(xué)習(xí)的變體包括逆向強(qiáng)化學(xué)習(xí)、階層強(qiáng)化學(xué)習(xí)和部分可觀測(cè)系統(tǒng)的強(qiáng)化學(xué)習(xí)。求解強(qiáng)化學(xué)習(xí)問題所使用的算法可分為策略搜索算法和值函數(shù)(Value Function)算法兩類。此外,深度學(xué)習(xí)模型可以在強(qiáng)化學(xué)習(xí)中使用,形成深度強(qiáng)化學(xué)習(xí)。

強(qiáng)化學(xué)習(xí)的目標(biāo)是,學(xué)習(xí)一個(gè)最優(yōu)策略,這個(gè)最優(yōu)策略是一個(gè)函數(shù)(類似于監(jiān)督學(xué)習(xí)算法中的目標(biāo)函數(shù)),它將一個(gè)狀態(tài)的特征向量作為輸入,并輸出一個(gè)該狀態(tài)下執(zhí)行的決策,該決策是連續(xù)的,目標(biāo)是長期的,如游戲流程、機(jī)器人行為、資源管理或物流管理。

1.1.5 何時(shí)使用ML

近年來,隨著ML技術(shù)和算力的發(fā)展,幾乎可以肯定的是,無論在哪個(gè)領(lǐng)域,ML都在為現(xiàn)有業(yè)務(wù)帶來新的機(jī)會(huì),ML也正在被用于推動(dòng)如下這些看似不相關(guān)領(lǐng)域的突破。

● 圖像處理,如人臉識(shí)別、智能安檢等。

● 語音處理,如自動(dòng)字幕、智能外呼等。

● 文本處理,如翻譯、智能客服等。

● 信息處理,如信息推薦、搜索引擎等。

這些領(lǐng)域中的每一個(gè)領(lǐng)域都可以擴(kuò)展更多的子領(lǐng)域(例如,用相同的算法可以推薦更多類別的商品,提高消費(fèi)者的體驗(yàn))。更重要的是,不同領(lǐng)域的業(yè)務(wù)場(chǎng)景和數(shù)據(jù)雖有差異,但適用的算法是相通的,這意味著一種算法的進(jìn)步可以促進(jìn)許多領(lǐng)域的進(jìn)步。這幾乎適用于所有領(lǐng)域,包括醫(yī)學(xué)、農(nóng)業(yè)、營銷、金融及安全等。隨著人們對(duì)數(shù)據(jù)的關(guān)注度越來越高,ML模型也會(huì)進(jìn)一步改進(jìn),從而形成良性循環(huán)。

看得出,ML正在逐漸成為解決業(yè)務(wù)問題的強(qiáng)大工具。然而,像任何工具一樣,它應(yīng)該在正確的場(chǎng)景下使用,而不是任何場(chǎng)景中的任何問題都用ML技術(shù)來解決。比如,當(dāng)實(shí)際場(chǎng)景所涉及的問題可以通過確定性規(guī)則及預(yù)先設(shè)定的步驟來滿足需求時(shí),就不需要使用ML技術(shù)了。所以,在使用ML技術(shù)之前,需要首先對(duì)當(dāng)前場(chǎng)景做一些初步的判斷,下面給出幾類ML技術(shù)可能適用的場(chǎng)景。

● 無法通過經(jīng)驗(yàn)給出規(guī)則。在業(yè)務(wù)問題非常復(fù)雜的情況下,無法枚舉所有的規(guī)則來解決它,而局部的解決方案是可行和有效的,這個(gè)時(shí)候可以嘗試用ML來解決這個(gè)問題。舉例來說,人類幾乎不可能根據(jù)像素值編寫出一套確定的規(guī)則來自動(dòng)檢測(cè)圖像中的動(dòng)物及其所屬類別,但通過向卷積神經(jīng)網(wǎng)絡(luò)(CNN)輸入數(shù)萬張經(jīng)過標(biāo)注的不同動(dòng)物的圖像,就可以構(gòu)建一個(gè)比人類能更準(zhǔn)確地執(zhí)行這種分類任務(wù)的模型。類似這種場(chǎng)景就比較適合使用ML技術(shù)。

● 已經(jīng)擁有很多干凈的、結(jié)構(gòu)良好的數(shù)據(jù),而且當(dāng)前業(yè)務(wù)已依賴這些數(shù)據(jù)來做決策。對(duì)數(shù)據(jù)的依賴是一個(gè)很好的跡象,表明業(yè)務(wù)可以從ML技術(shù)中獲得價(jià)值。例如,在信用卡授信業(yè)務(wù)中,數(shù)據(jù)分析師手動(dòng)探索消費(fèi)者的行為和違約數(shù)據(jù),試圖從數(shù)據(jù)中獲取規(guī)律,然后對(duì)新的申請(qǐng)者進(jìn)行授信。

● 目標(biāo)問題不斷發(fā)生變化。在某些場(chǎng)景下,目標(biāo)值會(huì)隨著時(shí)間的推移不斷發(fā)生變化,必須定期更新代碼來重構(gòu)規(guī)則,這樣會(huì)增加錯(cuò)誤的概率,因?yàn)槿祟愅ǔ:茈y通過記憶將“歷史”與“現(xiàn)在”充分結(jié)合,類似這種場(chǎng)景就比較適合使用ML技術(shù)。

● 無法擴(kuò)展。對(duì)于互聯(lián)網(wǎng)營銷領(lǐng)域,在業(yè)務(wù)發(fā)展初期,業(yè)務(wù)人員可以根據(jù)商品屬性及個(gè)人經(jīng)驗(yàn)來定義業(yè)務(wù)規(guī)則,實(shí)現(xiàn)對(duì)符合條件的用戶進(jìn)行運(yùn)營。但當(dāng)業(yè)務(wù)不斷發(fā)展壯大,積累了大量的用戶群和互聯(lián)網(wǎng)日志時(shí),業(yè)務(wù)人員根據(jù)經(jīng)驗(yàn)對(duì)當(dāng)前的業(yè)務(wù)進(jìn)行分析和運(yùn)營,就會(huì)顯得很吃力。類似這種場(chǎng)景就可以讓機(jī)器去學(xué)習(xí)日志中的隱藏模式,對(duì)用戶行為進(jìn)行總結(jié)和推斷。

進(jìn)一步地,這里有一個(gè)判斷ML適用場(chǎng)景的簡(jiǎn)單流程圖,如圖1-2所示,該流程圖可以幫助從業(yè)者弄清楚當(dāng)前遇到的業(yè)務(wù)場(chǎng)景是否屬于ML的使用范疇。

圖1-2 判斷ML適用場(chǎng)景的流程圖

主站蜘蛛池模板: 南投县| 崇文区| 河西区| 泰兴市| 博兴县| 博客| 广州市| 普兰县| 华容县| 洛浦县| 临海市| 当阳市| 闸北区| 泽州县| 万山特区| 临沧市| 海南省| 会昌县| 景东| 方山县| 陵川县| 章丘市| 武强县| 安仁县| 朝阳市| 许昌县| 丽江市| 水富县| 浦江县| 霍山县| 油尖旺区| 西和县| 高台县| 肇东市| 新安县| 枞阳县| 瑞昌市| 绥江县| 上栗县| 岑巩县| 中宁县|