官术网_书友最值得收藏!

1.2 人工智能的技術路線

1.2.1 機器學習

在當前的人工智能領域,機器學習,或者更準確地說,“大數據+深度學習”的技術路線已經成為研究的主流。這種主流甚至表現在,只要想對人工智能進行稍微深入一點的了解,就一定會看到“機器學習”這個名詞。那么,什么是機器學習?

顧名思義,機器學習試圖讓機器擁有人類的學習能力。機器學習作為一個術語,最早是由人工智能領域的先驅亞瑟·塞繆爾(Arthur Samuel)在1959年提出的,并表示“它使計算機能夠在沒有明確編程的情況下進行學習”。而這種學習的目的在于改善系統的性能和效果。

這個解釋可能有些抽象,讓我們來舉個通俗的例子。想象你站在一個籃球場上,現在你需要完成罰球線上的定點投籃。第一次投籃,你用的力氣太小,籃球甚至沒有接觸到籃筐。于是在第二次,你使用了更大的力氣,結果這次籃球砸在籃板上彈了出去。到了第三次,你終于找到了最合適的力道,投籃命中。在這個過程中,每一次失敗的投籃都是一次經驗的累積,通過對這些經驗的利用,你才能在最后一次投籃成功。

機器學習的過程也是類似的。計算機使用學習算法(learning algorithm)從數據中累積經驗,生成模型(model)——這個過程稱為“學習”(learning)或者“訓練”(training),訓練中使用的數據稱為“訓練數據”(training data)。之后面對新的情況時,模型就可以幫助計算機做出判斷和行動。

具體來說,在確定好任務目標之后,機器學習的過程主要包括以下幾步:收集數據——數據預處理——特征提取與處理——選擇合適的學習算法進行訓練,生成模型——評估模型效果——調整訓練過程中的參數、變量,優化模型效果——開始使用。當然,不同的機器學習方式在具體執行過程中采用的方法是有所差別的。根據學習的過程中是否有人類監督,機器學習可以分為監督學習(supervised learning)、無監督學習(un-supervised learning)、半監督學習(semi-supervised learning)和強化學習(reinforcement learning)。

監督學習使用人類事先打好標簽的數據集訓練模型,然后根據新輸入的數據,來判斷它的類別,或者預測它的值,也就是所謂的分類和回歸。例如,判斷你今晚看到的月亮是陰是晴是圓是缺就是分類,而預測未來的月相就是回歸。監督學習是機器學習中最常用的類型,其經典算法模型有K-近鄰(KNN)、線性回歸、樸素貝葉斯、邏輯回歸、決策樹(decision tree)、支持向量機(support vector machine,SVM)、支持向量回歸(SVR)、隱馬爾可夫模型(HMM)、條件隨機場(CRF)等。

而在無監督學習中,機器學習算法需要在未標注的數據中尋找模式,因為有的時候人工標注的成本很高,或者人類也缺少相關經驗無法進行標注。無監督學習不像監督學習擁有明確的任務目標,學習效果也無法量化評估,但可以幫助我們發現一些沒有注意到的規律或者趨勢。無監督學習最常見的算法是聚類和降維。聚類就是對數據進行特征提取并分類,常用的算法有K均值聚類(K-means)、層次聚類、譜聚類、EM(最大期望)算法、高斯混合模型(GMM)等。降維有點類似壓縮,它是使用更少的但更有效的特征來表示數據,常用的算法有主成分分析(PCA)、奇異值分解(SVD)、因子分析(FA)、t分布隨機近鄰嵌入(t-SNE)等。無監督學習在異常檢測、網購推薦中都有所應用。

半監督學習則是綜合了監督學習和無監督學習的一種方法,它使用少量的有標簽數據和大量的無標簽數據進行訓練,可以解決監督學習對數據標注的依賴問題,也可以解決無監督學習準確率較低、應用范圍有限的問題。半監督學習對無標簽數據的使用依賴于半監督假設,當假設正確時,半監督學習才能實現較好的學習性能。半監督學習的三大基本假設包括:①平滑假設(smoothness assumption):彼此更接近的點更有可能具有相同的類別標簽。②聚類假設(cluster assumption):數據可以分為離散的集群,同一集群中的點更有可能具有相同的類別標簽。③流形假設(manifold assumption):將高維數據嵌入低維流形中,當兩點位于低維流形中的一個小局部領域內時,它們具有相同的類別標簽。因為是對監督學習和無監督學習的綜合,所以分類、回歸、聚類、降維這四種方法半監督學習都有,具體如圖1-4所示。

圖1-4 半監督學習方法

至于強化學習,它與上述機器學習方式的不同之處在于,它采用的是一種獎勵的思路:強化學習算法并不需要依靠事先準備好的數據(無論是否有標簽)來學習,而是從自身行為獲得的獎勵多少來累積經驗,以最大回報為目標驅動結果的改進。強化學習有五個關鍵的要素:代理(agent)、環境(environments)、狀態(states)、動作(actions)和獎勵(rewards)。處在某個環境中的代理在執行了某個動作后,使環境轉換到了一個新的狀態。環境根據這個新的狀態給出獎勵信號(正獎勵或負獎勵),代理根據接收到的獎勵反饋和新的環境狀態再去執行新的動作。整個過程會不斷循環,直到代理獲得最大的獎勵。這種描述聽起來很像游戲,事實上強化學習在游戲中的應用也是最多的。強化學習常用的算法有蒙特卡洛方法(Monte-Carlo learning)、時序差分學習(temporal-difference learning)、SARSA算法、Q-learning算法等。

近年來很火的深度學習其實也是機器學習的一種,但它并不適用于上述的分類標準,因為它是利用人工神經網絡來模仿人類大腦的方法。深度學習的起源可以追溯到20世紀40年代,但直到2006年相關研究才取得較大突破,進入快速發展的時期。深度學習的核心過程其實非常簡單,一共就三步:選擇神經網絡架構——確定學習目標——開始學習。目前比較常用的神經網絡架構包括深度神經網絡(deep neural networks,DNN)、時間延遲神經網絡(time delay neural network,TDNN)、深度置信網絡(deep belief networks,DBN)、卷積神經網絡(convolutional neural networks,CNN)、卷積深度置信網絡(convolutional deep belief networks,CDBN)、生成對抗網絡(generative adversarial networks,GAN)、循環神經網絡(recurrent neural network,RNN)等。這些神經網絡架構有非常多的隱藏層(可以多達150個),而傳統的神經網絡一般只包含2~3個,這也是“深度”這個叫法的由來。和傳統機器學習相比,深度學習也非常依賴數據,而且需要的數據量更大,兩者在數據準備和預處理方面都是很相似的。它們的差別主要體現在數據特征的提取上,傳統機器學習主要依賴人工,而深度學習則是靠算法自動提取的。這也是深度學習會被人詬病可解釋性較差的原因。深度學習目前已經應用到了圖像分類、語音識別、自然語言處理、自動駕駛汽車等各個細分領域的研究當中,當然,在大眾認知中最有名的還是打敗了圍棋世界冠軍的人工智能AlphaGo。

1.2.2 類腦智能計算

雖然機器學習及深度學習已經成為當下人工智能領域主流的技術路線,但是其底層仍未擺脫傳統的“馮·諾依曼”計算機體系架構,計算能力依然受限。如果這個載體徹底更換,可能為強人工智能的實現帶來新的機會。因此部分研究者提出了類腦智能的想法,希望以生物腦作為參照,利用腦科學的研究成果,構造逼近生物神經網絡的電子神經系統,推動人工智能的新發展。

目前深度學習所使用的人工神經網絡從其出發點來看,可以算作類腦的嘗試,但它實質上只是參考了大腦神經細胞間部分拓撲結構而搭建的數學模型,并非來自生物神經系統的數理解析結果,因此不能算作真正的類腦。從腦科學的發展來看,人類對大腦的認知還十分有限,類腦智能的研究自然也只是處于萌芽階段,目前的研究方向集中在類腦模型與類腦信息處理、類腦芯片與計算平臺等方面。不過,各大國都意識到了腦科學研究的重要性,歐盟、美國、日本、中國等都推出了國家級的腦計劃,成立了一批相關的研究機構。未來的類腦智能能否有所突破,還需要腦科學、神經科學、認知科學、計算機科學、人工智能等各領域研究者的共同努力。

1.2.3 量子智能計算

除了類腦智能,還有研究者提出將量子力學與人工智能結合起來,把量子計算作為人工智能發展的另外一條可能的技術路線。

20世紀80年代,諾貝爾物理學獎獲得者理查德·費曼(Richard Feynman)有感于經典計算機的局限,提出了量子計算的概念。1994年,貝爾實驗室的物理學家皮特·秀爾(Peter Shor)對量子比特的研究,證明了量子計算機在計算速度上的優勢,研究者們開始構建具有更多量子比特的量子計算機。2011年,加拿大計算機公司D-Wave制造出了擁有128個量子比特的首臺商用量子計算機,量子計算機的研究開始飛速發展。這也從硬件層面促進了量子人工智能的發展。而從國家政策層面來看,歐盟出臺的《量子宣言》,以及美國的《量子計算發展白皮書》也都說明了政府層面對這項技術的看好。

目前的量子人工智能主要依靠腦量子場論、神經系統的量子態論、微管引力理論作為理論基礎,其研究主要還是集中在對已有機器學習、深度學習的優化上,并沒有出現算法上的突破。同類腦智能一樣,量子智能的發展還需要更多研究人員的投入。

主站蜘蛛池模板: 棋牌| 喜德县| 如东县| 宜阳县| 宜春市| 金塔县| 茌平县| 新兴县| 通辽市| 山东省| 汕头市| 呼伦贝尔市| 临海市| 太保市| 岳池县| 茂名市| 海林市| 东安县| 南丰县| 通辽市| 保康县| 深泽县| 宿州市| 宾阳县| 那曲县| 凯里市| 正定县| 滨海县| 陆丰市| 天长市| 盖州市| 新郑市| 区。| 昌图县| 罗源县| 禹州市| 噶尔县| 安吉县| 瑞丽市| 南投县| 徐闻县|