官术网_书友最值得收藏!

一、機器學習

機器學習(Machine Learning)是一門涉及統計學、系統辨識、逼近理論、神經網絡、優化理論、計算機科學、腦科學等諸多領域的交叉學科,研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能,是人工智能技術的核心。基于數據的機器學習是現代智能技術中的重要方法之一,研究從觀測數據(樣本)出發尋找規律,利用這些規律對未來數據或無法觀測的數據進行預測。根據學習模式、學習方法以及算法的不同,機器學習存在不同的分類方法。

1.按學習模式分類

根據學習模式將機器學習分為圖2-1所示的三類。

圖2-1 根據學習模式將機器學習分類

(1)監督學習。監督學習是利用已標記的有限訓練數據集,通過某種學習策略/方法建立一個模型,實現對新數據、實例的標記(分類)或映射,最典型的監督學習算法包括回歸和分類。監督學習要求訓練樣本的分類標簽已知,分類標簽精確度越高,樣本越具有代表性,學習模型的準確度越高。監督學習在如圖2-2所示等領域獲得了廣泛應用。

圖2-2 監督學習的應用領域

(2)無監督學習。無監督學習是利用無標記的有限數據描述隱藏在未標記數據中的結構或規律,最典型的非監督學習算法包括單類密度估計、單類數據降維、聚類等。無監督學習不需要訓練樣本和人工標注數據,便于壓縮數據存儲、減少計算量、提升算法速度,還可以避免正、負樣本偏移引起的分類錯誤問題。主要用于如圖2-3所示等領域,例如組織大型計算機集群、社交網絡分析、市場分割、天文數據分析等。

圖2-3 無監督學習的應用領域

(3)強化學習。強化學習是智能系統從環境到行為映射的學習,以使強化信號函數值最大。由于外部環境提供的信息很少,強化學習系統必須靠自身的經歷進行學習。強化學習的目標是學習從環境狀態到行為的映射,使得智能體選擇的行為能夠獲得環境最大的獎賞,使得外部環境對學習系統在某種意義下的評價為最佳。強化學習在如圖2-4所示等領域獲得成功應用。

圖2-4 強化學習的應用領域

2.按學習方法分類

根據學習方法可以將機器學習分為圖2-5所示的兩類。

圖2-5 根據學習方法將機器學習分類

(1)傳統機器學習。傳統機器學習從一些觀測(訓練)樣本出發,試圖發現不能通過原理分析獲得的規律,實現對未來數據行為或趨勢的準確預測。相關算法包括邏輯回歸、隱馬爾科夫方法、支持向量機方法、K近鄰方法、三層人工神經網絡方法、Adaboost算法、貝葉斯方法以及決策樹方法等。傳統機器學習平衡了學習結果的有效性與學習模型的可解釋性,為解決有限樣本的學習問題提供了一種框架,主要用于有限樣本情況下的模式分類、回歸分析、概率密度估計等。傳統機器學習方法共同的重要理論基礎之一是統計學,在如圖2-6所示的許多計算機領域獲得了廣泛應用。

圖2-6 傳統機器學習的應用領域

(2)深度學習。深度學習是建立深層結構模型的學習方法,典型的深度學習算法包括深度置信網絡、卷積神經網絡、受限玻爾茲曼機和循環神經網絡等。深度學習又稱為深度神經網絡(指層數超過3層的神經網絡)。深度學習作為機器學習研究中的一個新興領域,由Hinton等人于2006年提出。深度學習源于多層神經網絡,其實質是給出了一種將特征表示和學習合二為一的方式。深度學習的特點是放棄了可解釋性,單純追求學習的有效性。經過多年的摸索嘗試和研究,已經產生了諸多深度神經網絡的模型,其中卷積神經網絡、循環神經網絡是兩類典型的模型。卷積神經網絡常被應用于空間性分布數據;循環神經網絡在神經網絡中引入了記憶和反饋,常被應用于時間性分布數據。深度學習框架是進行深度學習的基礎底層框架,一般包含主流的神經網絡算法模型,提供穩定的深度學習API,支持訓練模型在服務器和GPU、TPU間的分布式學習,部分框架還具備在包括移動設備、云平臺在內的多種平臺上運行的移植能力,從而為深度學習算法帶來前所未有的運行速度和實用性。目前主流的開源算法框架有Tensor Flow、Caffe/Caffe 2、CNTK、MXNet、Paddle-paddle、Torch/Py Torch、Theano等。

3.按算法分類

根據算法可將機器學習分為圖2-7所示的三類。

圖2-7 根據算法將機器學習分類

(1)遷移學習。遷移學習是指當在某些領域無法取得足夠多的數據進行模型訓練時,利用另一領域數據獲得的關系進行的學習。遷移學習可以把已訓練好的模型參數遷移到新的模型指導新模型訓練,可以更有效地學習底層規則、減少數據量。目前的遷移學習技術主要在變量有限的小規模應用中使用,如基于傳感器網絡的定位、文字分類和圖像分類等。未來遷移學習將被廣泛應用于解決更有挑戰性的問題,如視頻分類、社交網絡分析、邏輯推理等。

(2)主動學習。主動學習是指通過一定的算法查詢最有用的未標記樣本,并交由專家進行標記,然后用查詢到的樣本訓練分類模型來提高模型的精度。主動學習能夠選擇性地獲取知識,通過較少的訓練樣本獲得高性能的模型,最常用的策略是通過不確定性準則和差異性準則選取有效的樣本。

(3)演化學習。演化學習對優化問題性質要求極少,只需能夠評估解的好壞即可,適用于求解復雜的優化問題,也能直接用于多目標優化。演化算法包括粒子群優化算法、多目標演化算法等。目前針對演化學習的研究主要集中在演化數據聚類、對演化數據更有效的分類,以及提供某種自適應機制以確定演化機制的影響等。

主站蜘蛛池模板: 武威市| 黄冈市| 泸定县| 阜阳市| 屏南县| 堆龙德庆县| 新竹市| 思南县| 阿坝县| 五指山市| 莱阳市| 本溪| 洪洞县| 文登市| 株洲县| 青阳县| 大埔区| 泰兴市| 光山县| 湘乡市| 新郑市| 天峻县| 明水县| 岱山县| 虞城县| 阳东县| 仁怀市| 左云县| 湖北省| 仙桃市| 广安市| 宽甸| 南通市| 进贤县| 渭源县| 大名县| 仲巴县| 合阳县| 嘉峪关市| 喀什市| 新河县|