官术网_书友最值得收藏!

1.2 人工智能的常見流派

說起人工智能歷史,如果從人類想象構建一個具有智慧的機器開始,其實可以追溯到很久之前。從大家熟知的匹諾曹的故事中可以看出,人類其實很早就開始尋找一種具有智慧并能輔助我們的工具。現在意義上的人工智能,其最早被提出可以追溯到古典哲學時代,古典哲學家們試圖將人類思考的過程描述為一些符號運算。這項工作在20世紀40年代可編程數字計算機發(fā)明時期達到了第一個高潮,借助這種能將數學抽象、推理、付諸實踐的機器,科學家開始認真考慮如何構建一個電子大腦。在這個過程中逐漸演化出了以下3個流派。

1.符號主義

1944年,赫伯?西蒙(Herb Simon)發(fā)表了他的觀點,他認為,“任何理性的決定都可以看作在某些前提下得出的結論,因此,只要指定了決策依據的價值和事實前提,就可以控制一個理性人的行為”。這個觀點為符號主義理論奠定了基礎。符號系統基于如下假設:可以通過對符號的操作在許多方面實現智能的行為。這個流派的典型代表就是專家系統,即將符號規(guī)則用類似if…then語句進行連接,就可以使用人類可讀的符號來處理規(guī)則,得出結論并確定需要哪些附加信息。20世紀60 年代,這種方法在一些小型演示中取得了巨大的成功,使基于控制論或人工神經網絡(ANN)的理論幾乎被遺忘。

2.連接主義

上面提到了人工神經網絡,其實它比符號主義更加久遠,但直到20世紀中后期才被人們認識。連接主義是認知科學領域中的一種方法,其希望使用人工神經網絡來解釋心理現象。連接主義提出了一種認知理論,該認知理論基于同時發(fā)生的、分布的、可以量化的信號活動,通過經驗調整連接強度來進行學習。連接主義的優(yōu)點包括適用于多種場景、與生物神經元的結構近似、對先天結構的要求低,以及適度降級。但連接主義也包含一些缺點,如難以解釋人工神經網絡如何處理信息,以及由此帶來的更高層次的現象解釋難度。

3.行為主義

行為主義又稱為進化主義或控制論學派。行為主義的本質是探索世界的一種跨學科研究方法,包括研究結構、約束和可能性等。行為主義源于神經病學的一項研究,其認為大腦是一個以全有或全無脈沖發(fā)射的神經網絡。20世紀40年代和50年代,許多研究人員對此進行了研究,他們中的一些人制造了使用電子網絡來展示基本智能的機器,如W.Gray Walter的海龜和Johns Hopkins的移動機器人。

其實上述3個流派的誕生時間都早于“人工智能”這個概念的誕生時間。1956年,Marvin Minsky、John McCarthy兩位資深科學家組織了達特茅斯會議。在會議上,John McCarthy說服參會者接受將“人工智能”這一名詞作為一種領域的名稱。這是“人工智能”領域首次獲得名稱,同時這一刻也被認為是現代人工智能的誕生時間。在這之后的若干年是一個大發(fā)現的時代,在這段時間里出現了一些令人驚訝的程序,計算機開始學會解決代數問題、證明幾何定理,甚至學會說英語。研究人員有著強烈的樂觀態(tài)度,并預測將在不到20年的時間內制造出完全智能的機器。然而在人們經過一段過于樂觀的時期之后,最終在1973年,因詹姆斯·萊特希爾(James Lighthill)的批評及國會不斷施加的壓力,美國和英國政府停止了對人工智能無方向研究的資助,隨后的艱難歲月被稱為“第一次人工智能冬天”。

回顧這段歷史我們不難發(fā)現,其實人工智能的發(fā)展并不是一帆風順的,其中經過了數次輪回,其理論發(fā)展也幾度起伏。各個流派都曾發(fā)揮過自己的優(yōu)勢,也表現出劣勢,如今伴隨著計算能力的突飛猛進,特別是圖形處理單元(GPU)的大規(guī)模普及,經過第二次人工智能冬天后,我們迎來了第三次人工智能的發(fā)展高潮。其中深度學習(Deep Learning)無疑是最熱門、最重要的一個發(fā)展方向,后面我們將探討什么是深度學習,這也是本書的研究重點。

提到深度學習,不難想到經常和它一起出現的一個名詞——大數據(Big Data),深度學習是構建在越來越快速、廉價的計算機硬件之上的,用來研究、處理海量數據的技術。相比于傳統的方法,深度學習似乎具有一種不可思議的普適性,如在自然語言的處理和理解、圖像識別等方面很快地擊敗了傳統的研究方法,達到了可以實用的程度。而它所采用的方法和之前的先觀察現象然后提煉規(guī)律、數學建模、模擬解析、實驗檢驗、修正模型又有非常大的不同。以一個識別手寫數字的過程為例,對其進行說明。通過觀察我們認為,數字9是由上面的圓圈與一個與該圓圈右側連接的向下的線段構成的,然后我們嘗試用程序實現識別數字9。當然這并不簡單,就算我們實現了這個算法,在實際運用時也會迅速陷入一個混亂的、充滿異常和特殊情況的泥潭中。

深度學習在處理這個問題時采用了完全不同的方式:選取大量的手寫數字(稱為訓練示例),然后開發(fā)一個可以通過這些訓練示例進行學習的系統。換句話說,神經網絡使用這些訓練示例來自動推斷用于識別手寫數字的規(guī)則。只需要增加訓練示例的數量,神經網絡就可以了解更多有關手寫數字的信息,從而提高識別準確性。這個過程簡單直接,也正是深度學習無可比擬的優(yōu)點。這只是其中一個示例,當我們換用不同的場景時,如人臉識別或語音識別,使用的方法基本相同,區(qū)別只在于訓練示例不同。我們可以在生物界中找到類似的例子,MIT的科學家做了這樣一個實驗,將一個年幼的猴子的視覺神經和聽覺神經剪斷后相互交換再連接起來,這完全不影響猴子的視覺和聽覺的發(fā)育。因此對于拓撲問題和幾何問題,我們可以采取完全不同的計算工具和理論。

另外深度學習還有一個優(yōu)點,相對于之前的研究方法,深度學習涉及的算法的數學理論相對簡單,工程化的難度相對較低。算法對深度學習來說并不是那么重要,更加重要的是擁有龐大和完整的數據。因為越多的數據意味著越多的抽象和越高的精度,深度學習通過構建類似人類視覺中樞中層次的概念,可以抽象出具體的特征,被低層網絡總結,而高層網絡又能從低層網絡中提取全局的抽象特征。因此深度學習通常可以將一些難以定性表達的事物抽象出來,如畫作的風格、音樂的風格等。這些特征現在可以被類似于權重和偏移的東西量化,從而被識別、處理、轉換和融合,如語音識別、人臉識別,這體現了深度學習無可比擬的實用價值,也為工業(yè)化、商業(yè)化提供了難以想象的廣闊空間。

但也正因為此,深度學習存在巨大缺陷,具體如下。

首先,因為使用了大量的權重等進行抽象,深度學習對于人類來說難以理解,也無法被解釋。另外從某種意義上來說,現在的深度學習更像一種分類,其通過對數據進行一些維度上的轉換得出一個概率上的分布。因此這種方法揭示了現象與結果間的相似性而非因果關系。但因果關系才是人類現代科學的基石,單純的相似性更像魔法而非科學,要想知道因果關系,還需經過深度提煉和總結。

其次,深度學習缺少通用性,深度學習一般是針對特定場景進行學習的。例如,針對人臉表情進行識別,其中涉及很多因素,如人臉的幾十條肌肉角度、光源強度、視角的方向等。為了訓練神經網絡,我們通常需要構建數十萬個維度,涉及的訓練數據量巨大,耗費時間也較長。并且我們越追求結果的精確性就越缺少通用性,因為這些維度一般并不適用于其他場景。

另外,深度學習的理論性相對較弱,對經驗性要求較強。參數的調節(jié)更像是一門藝術,而非工藝。和傳統的方法相比,深度學習的算法收斂性更低。雖然深度學習在視覺領域取得了令人矚目的成績,但在其他方面(如數學推理),特別是在定理證明方面,深度學習就無能為力了,因為深度學習的算法體現的是現象與結果之間的相似性,而非本質聯系,這導致深度學習的算法缺乏一個統一的世界觀,如人類通過觀察可以發(fā)現物質是受引力影響的,在沒有外力支撐時都是會下落的。對于深度學習來講,它可以通過訓練知道蘋果會從樹上掉落,卻不知道樹葉也會掉落。這種推理是符號主義所強調的,因此如何結合深度學習和符號主義將是今后人工智能需要研究的方向。

符號主義采用模仿數理科學的方式,將知識系統地整理成公理體系。符號主義將數學嚴格公理化,從公理出發(fā),由邏輯推理得到引理、定理、推論。廣義而言,符號主義將數學發(fā)現整理成了一系列的邏輯代數運算,將直覺洞察替代為機械運算。實踐表明,符號主義在初等幾何領域、機械定理證明上取得了巨大成功。例如,吳文俊方法和Groebner基方法可以推演出幾乎所有經典歐氏幾何的定理,即以輸入圖形的關鍵點建立坐標,將已知的幾何條件表示成代數方程(一般表示成關鍵點坐標的多項式方程),將結論的幾何條件轉化為多項式方程。因此定理證明即等價于驗證多項式生成的結果在確定的范圍。

和機械學習方法類似,機械定理證明將千奇百怪的幾何定理證明方法都轉化為一種方法,因此具有極大的普適性;同時,機械定理證明可以保證推導過程中出現錯誤的概率極小。人們一度相信,在計算機的幫助下,許多深刻的定理將會輕易被證明。

不過這里也存在機械主義推理的問題。

哥德爾的工作證明,對于任何一個公理體系,總存在一個客觀真理,不被此公理體系包含。這在某種意義上意味著人類探索自然真理的過程是無限的。對于任何一個包含算術公理體系的公理體系,總存在一個命題,這個命題無論對錯都和公理體系不發(fā)生矛盾。例如,我們知道有理數有無窮多個,實數有無窮多個,有理數可以和實數的一個子集建立雙射,實數無法和有理數的子集建立雙射,從這個意義上而言,有理數少于實數。那么,是否存在一個無窮數集,它的個數介于有理數和實數之間?這個問題的答案無論是有還是無,都不與現代數學公理體系發(fā)生矛盾。

另外,機械定理證明在根本上是“證明”了定理,還是“檢驗”了定理?

在數學歷史上,對于一個著名猜想的證明和解答而言,答案本身并不重要,在尋找證明的過程中凝練概念、提出方法、發(fā)展理論才是真正目的所在。機械定理證明雖然驗證了命題的真?zhèn)危菬o法明確地提出新的概念和方法,這背離了數學的真正目的。例如,地圖四色定理證明,數學家將平面圖的構型分成1936種,然后用計算機逐一驗證,在這一過程中,沒有新穎概念的提出。換言之,就是用機械蠻力替代了幾何直覺。

需要注意的是,機械定理證明的前提是問題的代數化。

初等幾何問題必須經過坐標化、條件和結論的代數化之后,才能運用理想理論來進行機械定理證明。但是,幾何問題代數化本身可能就是最“智能”的步驟。例如,大量黎曼幾何和低維拓撲中的命題無法被直接代數化。希爾伯特定理是說多元多項式環(huán)中的理想都是有限生成的,這一定理保證了Groebner基方法在有限步驟內停止,但是Groebner基方法在計算過程中消耗的空間有可能是超指數膨脹的,因此在現實中,對于復雜的定理證明,這個方法無法勝任。

另外,人類經常無法理解機械定理證明給出的結果,因此無法從中直接得到啟迪。

迄今為止,機械定理證明尚未發(fā)現具有重大意義的、人類未曾知道的定理。

雖然上文提到了一些符號主義的局限性,但實際上,符號主義和深度學習是互相融合、互相幫助的。例如,對于棋類比賽來說,傳統方法將棋類規(guī)則看作一個公理體系,利用邏輯推理加上空間搜索來進行推演。不過這會導致空間指數膨脹,如何減少這種膨脹就是問題關鍵。而“剪枝”(去掉多余無效的搜索路徑)依賴于通過經驗識別一些有意義的模式,這正是深度學習所擅長的。

世界是不完美的,雖然深度學習和符號主義各自都擁有一些缺陷,但并不能說深度學習這種方法是沒有意義的。例如,人類雖然可以輕松識別不同人的臉部,但為什么能識別張三是張三而不是李四也是我們無法解釋的。這其實就是我們的一種本能,人類神奇的地方就是產生了意識和智能。因此將大量這種類似本能的能力構建成一個具有相對統一標準的系統之時就是人工智能真正誕生之時。

主站蜘蛛池模板: 桑日县| 绿春县| 察隅县| 福安市| 北宁市| 蚌埠市| 平罗县| 山西省| 阿拉善右旗| 临猗县| 洪湖市| 杂多县| 松桃| 九江市| 靖远县| 满洲里市| 崇义县| 石门县| 永州市| 淮阳县| 沁阳市| 平湖市| 镇平县| 陆河县| 永安市| 顺平县| 余庆县| 诸城市| 崇文区| 哈密市| 通河县| 文山县| 宁武县| 阳谷县| 竹山县| 富锦市| 鄂尔多斯市| 兴文县| 台东市| 邹城市| 揭东县|