- 人工智能訓練師基礎(上冊)
- 武衛東等
- 8240字
- 2023-07-27 16:27:47
1.1 什么是人工智能
1.1.1 人工智能的定義與分類
概念的界定是一切研究展開的前提。什么是人工智能?這是每一本關于人工智能的著作都必須首先解答的問題。
追本溯源,“人工智能”一詞首次正式出現是在1955年8月31日的《人工智能達特茅斯夏季研究項目提案》中。參與此提案的學者麥卡錫(J. McCarthy)、馬文·明斯基(M. L. Minsky)、羅切斯特(N. Rochester)、香農(C. E. Shannon)這樣寫道:“我們提議1956年暑期在新罕布什爾州漢諾威的達特茅斯學院進行一次為期2個月、10人參加的人工智能研究。該研究是基于這樣一種猜想進行的,即學習的每個方面或智能的任何其他特征在原則上都可以被如此精確地描述,以至于可以制造機器來模擬它。我們將嘗試尋找如何使機器使用語言,形成抽象和概念,解決現在留給人類的各種問題,并改進自己。”提案中還有一個更明確的定義:“就目前的目的而言,人工智能問題被認為是使機器以一種被稱為智能的方式運行,如果人類如此表現的話。”更直白地說,他們認為人工智能就是用機器模仿人的智能。
這是對人工智能較早且較為流行的一個定義。但這種定義方式的背后其實是仿生學的思路,它沒有考慮到機器產生非類人的智能的可能,也就是說,機器有可能通過與人類智能完全不同的形式達到我們所謂智能的效果。這方面最有名的例子就是AlphaGo Zero——谷歌旗下DeepMind公司推出的圍棋人工智能程序。它在學習圍棋的過程中完全拋棄了人類棋手的經驗,通過自我訓練的方式,以100∶0的戰績戰勝了此前打敗過人類頂尖棋手李世乭、柯潔等人的AlphaGo。
麥卡錫后來也認識到了這種定義方式的局限,他在2007年一篇寫給外行的人工智能科普文章中給出了新的釋義:“它是制造智能機器,特別是智能計算機程序的科學和工程。它與使用計算機理解人類智能的類似任務有關,但人工智能不必局限于生物學上可觀察的方法。”他還進一步對智能作出了解釋:“智能是實現世界上目標的能力的計算部分。人類、許多動物和一些機器都具有不同種類和程度的智能。”但是,只有計算才是智能嗎?很顯然,人與環境的交互并不都是由計算來驅動的,雖然計算對智能機器而言必不可少。
從這個角度來說,尼爾斯·尼爾森(Nils J. Nilsson)對智能及人工智能的看法或許更為合適:“人工智能是致力于使機器變得智能的活動,而智能是使實體能夠在其環境中適當地運作并具有遠見的品質。”類似地,斯圖爾特·羅素(Stuart Russell)和彼得·諾維格(Peter Norvig)在人工智能教材《人工智能:一種現代的方法》中給出了這樣的定義:“我們將人工智能定義為從環境中接受感知并執行行動的智能體(agent)的研究。”他們還進一步地將人工智能分為四類:像人一樣行動、像人一樣思考、合理地思考、合理地行動。
中國電子技術標準化研究院發布的《人工智能標準化白皮書(2018版)》中也嘗試給出了自己的定義:“人工智能是利用數字計算機或者由數字計算機控制的機器模擬、延伸和擴展人的智能,感知環境、獲取知識并使用知識獲得最佳結果的理論、方法、技術及應用系統。”
可以看到,同其他難以界定的科學概念一樣,學界并沒有在“人工智能”的定義上達成共識。事實上,在人工智能的研究成熟之前,我們很難給出一個準確而適當的定義。在理論上或實踐中追求具體而明確的目標無疑更具有現實意義。不過,了解這些行業先驅與巨擘的觀點,可以幫助我們更好地理解這個方興未艾的人工智能世界。
與定義上的諸多分歧不同,在人工智能的類型問題上,學者們的意見比較一致。根據能力的不同等級,人工智能可以分為兩類:弱人工智能(weak AI)和強人工智能(strong AI)(圖1-1)。

圖1-1 人工智能的類型
弱人工智能,也稱狹義人工智能(narrow AI)或專用人工智能(artificial narrow intelligence,ANI),簡單來說就是達到專用或特定技能的智能。我們目前能夠成功實現和應用的人工智能都屬于弱人工智能——哪怕是看起來很厲害的無人駕駛汽車和AlphaGo——因為它們擅長的都只是單一的任務,無法在多領域發揮作用。
強人工智能,也稱通用人工智能(artificial general intelligence,AGI),是指達到或超越人類水平的、能夠自適應地應對外界挑戰的、具有自我意識的人工智能。也有學者對此進行了細分,把達到人類水平的稱作強人工智能,而超越人類水平的則是超人工智能(artificial super intelligence,ASI)。無論是強人工智能還是超人工智能,目前都還停留在幻想的階段。但是,根據大多數人工智能專家的看法,超越人類能力的人工智能一定會出現。因為比起人類相對固定的智能水平,機器的智能正隨著算法的優化、處理能力的增強和內存的增加而快速增長,機器超越我們只是時間問題。超人工智能到來的時刻被稱作奇點(singularity)。對于奇點何時出現的問題,人工智能科學家也多次調查過同行們的看法,大多數人預計的時間都是2060年之前。這個估計會太過樂觀嗎?讓我們一起拭目以待。
如果從發展的眼光來看,人工智能又可以分為運算智能、感知智能、認知智能和自主智能,這也是人工智能應用的四個不同層次(圖1-2)。

圖1-2 人工智能的四個層次
(1)運算智能,即快速計算和記憶存儲的能力,這也是計算機的核心能力。
(2)感知智能,即視覺、聽覺、觸覺、識別、分類的能力。人類和高等動物都是通過自身豐富的感覺器官,獲取環境信息,與外界進行交互的。目前在機器人身上應用的各種傳感器和語音、圖像、視頻識別與分類等技術就是感知智能的體現。整體來說,運算智能和感知智能還停留在工具層面,并沒有觸及智能的核心。
(3)認知智能,即理解、判斷、分析、推理的能力。而現階段的人工智能雖然在運用自然語言處理、知識圖譜、深度學習(deep learning)機制和神經網絡(NNs)后,做到了一定程度的“能理解、會思考”,但仍然非常有限。此外,人類情緒對認知的影響,乃至于作為認知主要部分的潛意識,都是目前機器的認知智能難以模仿實現的。
(4)自主智能,即主動感知、自主決策、自我執行、自主創意、自發情感的能力。這種自主,不僅僅是無須人類干預就可以自由移動并與人類和其他物體交互——目前的無人機、無人駕駛等技術已經實現了某種程度上的自主,更重要的是擁有自我意識、自我認知乃至自我價值觀——這是目前只存在于科幻小說與電影中而現實的人工智能尚未或許永遠也無法觸及的部分。
1.1.2 人工智能的起源與發展
回顧歷史,人工智能其實可以追溯到古代的“人造人”想象。在2700年前的古希臘神話中,就出現了塔羅斯(Talos)、潘多拉(Pandora)、“黃金女仆”(the Golden Maidens)和加勒提亞(Galatea)這四個人造人的形象。前三者都是火與工匠之神赫菲斯托斯(Hephaestus)制造的:塔羅斯是用青銅鑄造的巨人,他受命守衛著克里特島,防止外來者的侵犯;潘多拉作為對普羅米修斯盜火的懲罰,其身體由黏土塑造,被眾神賦予了誘人的魅力、語言的技能以及裝滿了災厄的魔盒;黃金女仆則是用黃金鍛造的女機器人,她們會開口說話并協助赫菲斯托斯在其宮殿中進行高難度的工作。加勒提亞則是塞浦路斯島的國王皮格馬利翁(Pygmalion)用白色象牙雕刻出的理想女性,她被愛神阿佛洛狄忒(Aphrodite)賦予了生命。不止西方,在中國戰國時期的典籍《列子》湯問篇中,也記載有西周時期的巧匠偃師向周穆王進獻能歌善舞、以假亂真的人偶的故事。可以看出,這些神話傳說中的人造人擁有的能力與人們如今對人工智能的期許并無多大不同,盡管這些能力的實現基本上靠的是神力而非人力。
雖然古代人并不相信自己能像神一樣造人,但他們在實際的生產生活中制造了許多減輕或替代人類勞動的工具,如耕地的犁、翻地的耙、灌溉的水車、收割的鐮刀等。到了中世紀,人們開始制造自動機械裝置,即自動機(automaton)。已知最早有據可考的自動機來自阿拉伯的博學家艾爾-加扎利(Al-Jazari),他發明了一艘載有4個木偶的小船,可以通過水流的驅動讓木偶演奏音樂。因為互換負責音符的木栓可以讓木偶演奏出不同的旋律,所以這被認為是第一個可編程的人形機器人。14世紀,機械鐘出現,鐘表業開始發展。發條、齒輪等鐘表技術漸漸被擴展開來用于制造機械動物和人偶,如意大利博學家達·芬奇的機械獅和機器武士。到了18世紀,隨著第一次工業革命的逐步展開,人類從手工勞動進入大機器生產的時代。機器生產的發達,使得更多的自動機開始出現,如法國發明家雅克·德·沃康松(Jacques de Vaucanson)的消化鴨,匈牙利發明家沃爾夫岡·馮·肯佩倫(Wolfgang von Kempelen)的土耳其行棋傀儡(the Turk),瑞士鐘表匠皮埃爾·雅克-德羅茲(Pierre Jaquet-Droz)的三個自動機械人偶“小作家”“小繪圖師”和“小音樂家”等。雖然這些自動機只是社會上層娛樂的玩物,但作為模仿生物及人類智能行為的機器,它們可以被視作人工智能的前導和先聲。
從制造工具到制造機械人偶,這一變化不僅意味著人的工具職能更多地被機器替代,更昭示了一種世界觀的轉變——人對自我的認識從“人是上帝的創造物”變成了“人是機器”。17世紀初,法國哲學家、數學家笛卡兒(René Descartes)提出了身心二元論,認為人是由身體和心靈兩種完全不同的實體組成的。同時他還認為動物的身體只不過是復雜的機器,人體功能是以機械方式發生作用的。與笛卡兒同時代的英國政治家、哲學家霍布斯(Thomas Hobbes)雖然并不贊成笛卡兒的二元論,但他卻更進一步地認為,人是一種由上帝創造的“像鐘表一樣用發條和齒輪運行的‘自動機械機構’”:人的“‘心臟’無非就是‘發條’,‘神經’只是一些‘游絲’,而‘關節’不過是一些‘齒輪’”。而到了18世紀,作為機械唯物主義代表的法國思想家、哲學家拉美特利(Julien Offroy de la Mettrie)則完全拋棄了上帝,并且非常直白提出了“人是機器”的觀點。他認為,人的心靈活動依賴于大腦和整個身體組織,因此和身體活動一樣,也屬于機械運動。所以,人整個就是一臺機器。雖然這種把思想當作物質屬性來論證的方式缺乏說服力,但是將人類身體機械化的觀點卻影響深遠。在現代科技的支持下,人類的部分身體組織已經可以被仿生義肢、機械外骨骼等機械裝置替代或者增強,各種模仿人體形態和行為的仿人機器人也不斷涌現。
但是,身體的機械化還不足夠,人工智能的思想根源在于人類心靈(或者說人類思維活動)的機械化。這一觀點也可以追溯到笛卡兒。笛卡兒將數學提升為一種普遍適用的科學方法,提出了“普遍數學”,即把數學最一般的特征“度量”和“順序”運用到其他學科來認知萬物。他認為,人類認識領域的任何問題都可以轉化為數學問題,人類的認識過程就是數學計算。類似地,霍布斯也認為,真正科學的知識只有在感覺經驗的基礎上運用推理方法才能獲得,而推理就是計算。到了功利主義學派代表人物邊沁(Jeremy Bentham)那里,計算就不僅限于心靈的認知層面了,人的情感、欲求、感受等的產生都是基于心靈對快樂和痛苦這兩種體驗的程度的計算與比較,而趨樂避苦是人類一切思想、情感、行為的動機。所以,心靈的本質就是計算。
然而,由于各種生理因素的限制,人類心靈計算的能力參差不齊,并不完善。于是,人們就開始了將數學運算機械化的嘗試,企圖通過機器的運算來實現純粹的、完美的數學運算。1642年,法國哲學家、數學家帕斯卡(Blaise Pascal)發明了第一臺機械計算器——加法器(Pascaline)。1673年,德國哲學家、數學家萊布尼茨(G.W. Leibniz)發明了第一臺機械式的十進制四則運算器。數學運算的機械化就此開始并不斷發展,直到現在的電子計算機階段。當然,電子計算機的研制成功以及后來人工智能的誕生,還離不開數理邏輯的發展——這是一門用數學的方法來研究形式邏輯,以及研究形式邏輯在其他數學領域的應用的學科。從布爾的布爾代數、弗雷格的一階謂詞演算系統,到哥德爾的不完全性定理、克林的一般遞歸函數理論,再到圖靈(Alan Turing)的理想計算模型圖靈機,這些經典的數理邏輯理論成果為1956年人工智能的正式誕生奠定了堅實的基礎。
1956年7月到8月,麥卡錫召集的人工智能夏季研討會在達特茅斯順利舉行。會議聚集了當時相關領域的頂尖研究人員,對人工智能的問題展開了開放式的討論。盡管從結果來看,與會人員并未就人工智能領域的標準方法達成一致,甚至對“人工智能”這個叫法都存在分歧,但他們都認同人工智能是可以實現的。這次會議也催化了之后蓬勃發展的人工智能研究,因此被后人視為人工智能誕生的標志。
不過,在1956年之前,人工智能的相關研究已經開始了。1943年至1955年這段時期可以稱作人工智能的孕育期。1943年,沃倫·麥卡洛克(Warren McCulloch)和沃爾特·皮茨(Walter Pitts)的人工神經元模型應該是現代人工智能領域最早的研究成果。1951年,馬文·明斯基與同學迪恩·愛德蒙(Dean Edmunds)合作建造了世界上第一臺神經網絡計算機SNARC(隨機神經模擬強化計算器)。當然,這一時期最重要的里程碑事件還是1950年英國數學家艾倫·圖靈提出的圖靈測試——如果一臺機器能夠與人類展開對話(通過電傳設備)而不能被辨別出其機器身份,那么稱這臺機器具有智能。雖然嚴格來說,圖靈測試并不嚴謹、完善,但其中已經蘊含有人工智能的原始概念,并明確了人工智能未來的發展目標,其劃時代的意義是毋庸置疑的。
從1956年開始,人工智能的發展大致經歷了三大階段:第一階段,從1956年到1979年,這是人工智能的誕生時期;第二階段,從1980年到2010年,人工智能開始步入產業化;第三階段,從2011年至今,人工智能的研究和應用迎來爆發。當然,這幾十年的發展歷程并非一路高歌猛進,也曾經出現過幾次起伏。所以,這三個階段又可以細分為六個時期(圖1-3)。

圖1-3 人工智能發展的時間軸
1.1956—1974年,黃金時期
達特茅斯會議后的近20年是人工智能發展的黃金時期,研究者們普遍樂觀,對人工智能的熱情和期望很高。這一時期代表性的研究成果有:感知器被發明,人工神經網絡[也稱連接模型(connection model)]迎來了第一次熱潮;麥卡錫開發了編程語言LISP,這是人工智能研究中最流行且仍受青睞的編程語言;工業機器人Unimate被部署在美國通用汽車公司,代替人類進行危險的裝配工作;世界上第一個聊天程序ELIZA誕生,它可以用英語與人交流;第一個可自主移動的機器人Shakey、第一個人形智能機器人WABOT-1誕生;第一個專家系統(1)DENDRAL研究完成并投入使用,它的作用是幫助化學家判斷特定物質的分子結構。
2.1974—1980年,第一次寒冬
盡管如此,黃金時期的很多樂觀承諾并沒有如期兌現,人們開始對人工智能產生懷疑。1973年,應用數學家詹姆斯·萊特希爾(James Lighthill)為英國科學委員會編寫的一份人工智能研究現狀報告發表。該報告對人工智能研究的許多核心方面都作出了非常悲觀的預測,稱“迄今為止,該領域的任何發現都沒有產生當時承諾的重大影響”。萊特希爾報告直接導致英國及其他各國政府和機構減少了對人工智能研究的資金投入,人工智能的發展進入第一次寒冬。
3.1980—1987年,繁榮時期
然而,寒冬中也孕育著生機。1978年,美國卡內基梅隆大學開始為DEC公司研發一款能制定計算機硬件配置方案的專家系統XCON。1980年, XCON投入商業使用,為DEC公司節省了大量成本。XCON的商業成功吸引了許多公司的效仿,專家系統所依賴的知識處理問題也成為這一時期的研究焦點。1982年,日本推出了第五代計算機計劃,其目標是造出具有人工智能的計算機系統。隨后,美、英、法、德、蘇聯等國也紛紛響應,投入資金加入角逐,人工智能開始進入新一輪的發展。
4.1987—1993年,第二次寒冬
20世紀80年代末期開始,個人電腦的性能不斷提升沖擊著AI硬件市場,曾經大獲成功的專家系統暴露出應用領域狹窄、知識獲取困難、維護費用居高不下等問題,日本人宏偉的第五代計算機計劃也宣告失敗。各國政府和投資者再次停止為人工智能研究提供資金,人工智能進入第二次寒冬。
5.1993—2010年,穩步發展
進入20世紀90年代,隨著計算機硬件的發展,人工智能終于取得了突破性的成果。這一時期最重要的里程碑事件莫過于1997年IBM的深藍擊敗了國際象棋世界冠軍加里·卡斯帕羅夫,人工智能從此進入大眾視野。2006年,杰弗里·辛頓(Geoffrey Hinton)提出了深度學習的概念,英偉達(Nvidia)推出了并行計算平臺和編程模型CUDA(統一計算設備架構)。2007年,李飛飛啟動ImageNet項目,試圖構建一個更好的數據集(data set)。研究者們在算法、算力和數據三方面的努力為人工智能接下來的爆發式發展打下了基礎。
6.2011年至今,爆發時期
2011年以來,深度學習算法開始在人工智能的子領域廣泛應用。這一時期的重要事件有:2011年,IBM的Watson在智力問答節目中獲勝。同年,蘋果公司的智能語音助手Siri問世。2014年,亞馬遜正式發布了智能音箱產品Echo。Siri和Echo引得各家廠商紛紛效仿,紛紛推出了自己的同類產品搶占市場。2015—2017年,谷歌DeepMind的AlphaGo不斷擊敗數位人類頂尖圍棋棋手。2018年,谷歌發布的BERT模型在自然語言處理領域取得了重大突破……(2)如今,人工智能的核心技術不斷發展,應用場景逐漸豐富,市場規模持續擴大,已成為時代發展的重要驅動力。
在人工智能的發展過程中,不同學科背景的學者對人工智能的看法各異,因而也產生了人工智能的不同學派。
1.符號主義學派
首先要提的便是符號主義學派。符號主義(symbolicism)又稱邏輯主義(logicism)、心理學派(psychologism)或計算機學派(computerism)。代表人物有艾倫·紐厄爾(Allen Newell)、赫伯特·西蒙(Herbert A. Simon)、尼爾斯·尼爾森等。
符號主義的思想源頭是19世紀中葉出現的數理邏輯。符號主義認為人類認知和思維的基本單元是符號,而認知過程就是符號上的操作運算。人被視為一個物理符號系統,計算機也是如此。因此,計算機可以用來模擬人類的行為。他們還認為,知識是信息的一種形式,是智力的基礎。人工智能的關鍵問題是知識表示和知識推理。概括來說,就是利用物理符號系統假設和有限合理性原理來實現人工智能。
符號AI(symbolic AI,sAI),或者有效的老式人工智能(good old-fashioned artificial intelligence,GOFAI),在人工智能發展的早期一直占據著主流,為人工智能的發展作出了許多重要貢獻。老式并不是對其過時的指責,而是意味著經典。只要是規則清晰、目標明確的任務,使用符號主義的方式是非常方便的。事實上,目前絕大多數的計算機程序和系統也還都是基于編程規則創建的。20世紀80年代流行的專家系統就是符號AI的代表性成果之一。
盡管如此,符號AI也有著非常明顯的局限。它嚴重依賴已經設定好的規則,并且無法處理存在大量變化的、非結構化的數據。舉例來說,讓符號AI在圖像中識別人臉就非常困難,因為你無法窮舉人臉的面貌與所處的環境,更難以創建對應的識別規則。專家系統從20世紀90年代開始逐漸遇冷也是如此,它所依賴的復雜符號與大量規則需要耗費大量人力,不便于維護,并且可以應用的領域也非常狹窄,沒有普適性。
2.連接主義學派
雖然符號主義學派在人工智能發展的早期占據了主流,但現下更受歡迎的卻是另一個學派——連接主義(connectionism)。連接主義又稱仿生學派(bionicsism)或生理學派(physiologism)。代表人物有沃倫·麥卡洛克、沃爾特·皮茨、約翰·霍普菲爾德(John Hopfield)、魯梅爾哈特(D.E. Rumelhart)等。
連接主義的思想源頭是仿生學中對人腦模型的研究,尤其是對人腦學習和記憶的研究。連接主義認為智能活動是由大量簡單單元通過復雜的相互連接后并行運行的結果。人腦不同于計算機,應該用人腦模式代替計算機模式。神經網絡及神經網絡間的連接機制與學習算法是這一學派的理論基礎。
連接主義的發軔其實很早,1943年,沃倫·麥卡洛克和沃爾特·皮茨就發表了一篇關于神經網絡和自動機的論文,對連接主義AI的研究影響深遠。20世紀60年代,連接主義的研究也曾出現過熱潮。但是由于效率低下的缺陷和對大量計算資源的需求,人們對連接主義的興趣逐漸降低。直到20世紀80年代,隨著基于遞歸的新一代神經網絡、多層感知機和神經網絡反向傳播算法的提出,連接主義才出現復興。進入21世紀,其更是掀起了深度學習的熱潮,在計算機視覺、自動語音識別(automatic speech recognition,ASR)、自然語言處理等方面都取得了很大的進展,成為當下人工智能的主流。
當然,連接主義AI(connectionist AI,cAI)也并非沒有缺點,需要大量高質量的數據,算法缺乏透明度,難以進行合理論證都是連接主義AI一直被人詬病的問題。此外,連接主義AI也很難解決需要邏輯和推理的任務,而這恰恰是符號AI擅長的。
3.行為主義學派
除了符號主義和連接主義,還有學者將行為主義(actionism)算作第三種學派。行為主義又稱進化主義(evolutionism)或控制論學派(cyberneticsism)。代表人物有諾伯特·維納(Norbert Wiener)、羅德尼·布魯克斯(Rodney Brooks)等。
行為主義學派的興起源于控制論。1948年,諾伯特·維納出版了《控制論——或關于在動物和機器中控制和通信的科學》,標志著控制論這門學科的誕生。控制論研究的是生命體、機器和組織的內部或彼此之間的控制與通信。控制論中的智能性原則認為不僅在人類和人類社會中,在其他生物群體乃至無生命的機械世界中,都存在著同樣的信息、通信、控制和反饋機制,智能行為是這套機制的外在表現,因此不僅人類,其他生物甚至是機器也同樣能做出智能行為。行為主義AI以此為理論基礎,提出了“感知—行動”的智能行為模擬方法,認為人工智能可以像人類智能一樣,在與周圍環境的交互過程中通過反饋機制不斷進化,發展出越來越強的智能。
由于控制論的原因,不少學者并不把行為主義AI劃入人工智能的范疇。在他們眼中,沿著這一理論路徑最多只能實現完美的機械自動化,難以達到真正的智能。