- 生成對抗網絡入門指南
- 史丹青
- 9字
- 2019-01-03 17:45:18
第1章 人工智能入門
1.1 人工智能的歷史與發展
2017年被稱為“人工智能元年”,這一年,被稱為“人類最后的希望”的圍棋天才柯潔與AlphaGo的進階版Master鏖戰三輪,最終以總比分0∶3敗于AlphaGo(見圖1-1)。這是谷歌DeepMind團隊的AlphaGo深度學習的第二次亮相。也是這一年,據PitchBook統計,全球人工智能和機器學習領域共獲得風險投資超過108億美元,而2010年才不足5億美元。也是這一年,“得AI人才者得天下”,在美國,深度學習領域的人工智能博士生都已被Google、Facebook、亞馬遜、微軟、英特爾席卷一空,AI人才的起步年薪達到百萬。一時間,仿佛身邊的人都開始習慣性地討論幾句“人和機器誰更厲害”的話題。

圖1-1 柯潔惜敗Master,淚灑現場
人工智能的熱浪乘風而上,技術圈和投資界歡欣鼓舞,似乎一個可以媲美100年前的電力、20年前的互聯網的機會正在到來(見圖1-2)。但真正了解這個領域的學術圈卻保持鎮定,因為這個蟄伏了大半個世紀的復雜學科,早已經歷了一次又一次的繁榮與低谷,2017年也許是新一輪的波峰。

圖1-2 2017年美國人工智能投資爆發
古希臘詩人荷馬在公元前8世紀曾描述過“鍛造之神”赫菲斯托斯,《伊利亞特》史詩中寫到他曾經設計并制作了一組金制的女機器人,這些機器人可以幫助他在鐵匠鋪做事,甚至能開口說話,并完成很多高難度工作。這可能是能夠追溯到的最早的人工智能誕生的傳說,人們開始想著不再僅僅把創造力放在靜物上,而是有自我意識的個體,這是思維的突破,是最本質的變化。
稍微對人工智能有所了解的人都知道圖靈(見圖1-3)。艾倫·麥席森·圖靈(Alan Mathison Turing),距離我們大半個世紀前的英國數學家,被稱為“計算機科學之父”,又被稱為“人工智能之父”。至今,圖靈獎(A. M. Turing award)作為“計算機界的諾貝爾獎”,依舊是最負盛名、最崇高的獎項。“如果一臺機器能夠與人類展開對話(通過電傳設備)而不能被辨別出其機器身份,那么稱這臺機器具有智能。”這就是里程碑式的人工智能圖靈測試。
其實在圖靈測試提出前,其他學科上偉大的突圍同樣為人工智能學科的建立奠定了堅實的理論基礎。人工智能簡而言之是打造“人工大腦”,那么有三個問題需要解答。

圖1-3 圖靈
● 大腦是如何運轉的?
● 大腦的運行機制是否可以拆分成差異性極低的可衡量單元?
● 是否有其他人工產物可以等價體現這一單元粒度的價值或功能?
其中,第二個問題由神經學家揭開謎團,第三個問題由信息學家給出答案,第一個問題至今仍在探索。
1.1.1 人工智能的誕生
1872年在意大利的阿比亞泰格拉索療養院里,29歲的卡米洛·高爾基(Camillo Golgi)在一次意外中創建了鉻酸鹽-硝酸銀染色法。在相隔1300公里的西班牙,一位同樣年輕的神經學家圣地亞哥·拉蒙-卡哈爾(Santiago Ramón Y Cajal)借助這種技術,在1888年發表了單個神經細胞存在的證據,由此創建了神經元理論,被后世認為是現代神經科學的起源。這兩位在1906年獲得了諾貝爾生理學或醫學獎。
神經系統由神經元(見圖1-4)這樣的基本單位構成,其激勵電平只存在“有”和“無”兩種狀態,不存在中間狀態。神經元二元論的觀察和電子信號的0和1之間竟有如此美妙的契合度,當然這個時候數字信號的二進制還沒有提出。另一個觀察是神經信號的傳導大多是單向的,由樹突到神經元細胞體再到軸突。基于簡單的兩個規律,神經網絡的雛形已經躍然紙上,如果我們現在乘坐“時光機”回去,肯定會站在上帝視角瘋狂吼叫:“結合起來!這就是神經網絡!我們可以做人造大腦了!”但科學研究的步伐何其艱難,這臨門一腳的突破蟄伏了50多年。

圖1-4 神經元
在50多年后的1940年,受神經學科奠基理論影響的42歲的沃倫·麥卡洛克(Warren McCulloch)和剛滿18歲的“羅素信徒”沃爾特·皮茨(Walter Pitts)相遇,3年后他們提出將數學和算法結合,建立了神經網絡和數學模型(見圖1-5),模仿人類的思維活動,從此劃開現代深度學習的序章。

圖1-5 神經元模型
至此,神經元作為可拆分的差異性極低的可衡量單元出現,并通過麥卡洛克和皮茨的努力,可以用數理化的方式進行描述。但存在于紙面算法的邏輯如何變成真正可執行的工程產物?克勞德·艾爾伍德·香農(Claude Elwood Shannon,信息論創始人)對繼電器的全新解讀登場了(見圖1-6)。

圖1-6 香農利用繼電器完成老鼠自助走迷宮實驗
繼電器是一種電子控制器件,通過電磁鐵來吸引一塊鐵片,以控制線路的開關。如果電源沒有接通,信息的流通量為0,如果電源接通,絕對理想情況下信息全部輸送。香農在《繼電器與開關電路的符號分析》中將邏輯代數的思想運用到了電路的設計上,用電子開關模擬布爾邏輯運算,解決了實際問題。
至此,“是否有其他人工產物可以等價體現這一單元粒度的價值或功能”這一問題也有了答案:繼電器或者晶體管,或者任何能夠輸出0和1這兩個信息符號的組件,都可以成為承載人工大腦信息傳輸的載體。
1943年,圖靈拜訪貝爾實驗室,與香農共進午餐,討論人造思維機器的設想,大有英雄所見略同之感。1950年,圖靈提出一個關于判斷機器是否能夠思考的著名試驗:“如果一臺機器能夠與人類展開對話(通過電傳設備)而不能被辨別出其機器身份,那么稱這臺機器具有智能。”
圖靈測試至今也很少完整地應用于辨別人類和機器,原因很簡單:機器還無法蒙混過關。但在一些影視作品里面可以看到完整的應用。1982年上映的《銀翼殺手》被視為有史以來最佳科幻電影之一,里面有一段經典的測試,叫作維特甘測試(Voight-Kampff test)。為了區分人類和復制人,會進行類似于“圖靈測試”的檢驗—被試者會被詢問幾十個不同的問題,檢測機器會通過查看他們的眼球運動等生理活動判斷是否符合人類的正常反應,或者通過觀測他們的回答方式、身體動作和即時反應來區分是否是真實人類。大部分復制人在這樣的測試下很快就會露出馬腳。感興趣的讀者可以去看看這部電影,見圖1-7。

圖1-7 《銀翼殺手》中的維特甘測試
1956年Dartmouth會議歷經兩個月的激烈討論,提出“人工智能”這一名稱,以及對應的學科任務。此會議也被稱為人工智能正式誕生的一大標志。至此,人工智能作為一個令人癡迷的科學學科正式登上歷史舞臺。
1.1.2 人工智能的兩起兩落
從1956年開始,人工智能的研究進入全盛時代,至此開始的十年也稱為“黃金十年”。這十年有很多成功的AI程序和新的研究方向出現,包括推理搜索的算法研究、自然語言處理、微世界研究等。AI學者構造出了一系列計算機程序。當時,人工智能研究者甚至認為:“二十年內,機器將能完成人能做到的一切工作”;“在三到八年的時間里我們將得到一臺具有人類平均智能的機器”。
然而好景不長,很快到了20世紀70年代,盛極一時的學術圈“寵兒”人工智能開始遭受如潮的質疑和批評。人們漸漸發現僅僅具有邏輯推理能力遠遠不能實現人工智能,許多難題并沒有隨著時間推移而被解決,很多AI系統一直停留在“玩具”階段。1974~1980年是人工智能研究的第一個“寒冬”,研究者的理論方向漫無目的是因素之一,更大的原因在于當時落后的計算機運算能力和數據收集能力。當時上限48KB內存的第四代計算機只能允許用一個含二十個單詞的詞匯表來演示在自然語言方面的研究結果,計算機離智能的要求還差上百萬倍。
很快,對AI提供資助的機構(如英國政府、DARPA和NRC)開始逐漸停止了資助,AI研究者也遭到了學術圈的冷遇。在此階段,學者內部也對人工智能的研究本質產生了爭執,并逐漸劃分為認為人工智能應該是解題機器的簡約派和堅持AI應具有與人類一樣的非邏輯性聯想能力的蕪雜派(the scruffies)。
1980年,簡約派的研究成果之一“專家系統”面市,這是人工智能的一個研究分支,它具有一種仿真決策能力。卡內基·梅隆大學為DEC(一家數字設備公司)設計并制造出一個專家系統,命名為XCON。DEC的VAX型計算機可以根據用戶的需求組裝不同的組件,有很多銷售人員并不是技術專家,所以難免出現配件購買錯誤的問題。XCON支持自動選擇組件,從1980年到1986年,每年為公司省下四千萬美元。一直被稱為研究玩具的人工智能因此掃除頹勢,進而獲得了1980年到1987年的第二個繁榮發展期。
許多公司紛紛效仿,開始研發和應用專家系統。知識工程作為專家系統的基礎,也成為當時AI研究的熱門方向。緊接著,日本提出第五代計算機計劃,注入大量的人才和財力,旨在創造出能夠與人交流、翻譯各國語言、識別圖像、具有一定推理邏輯能力的機器系統。也在同樣的時期,David Rumelhart提出著名的反向傳播算法(BP算法),解決了多層神經網絡學習過程中遇到的諸多問題。由于這個算法的提出,神經網絡開始作為主流算法廣泛應用于機器學習的各大領域,比如模式識別、預測和智能控制等。AI迎來了又一輪高潮。
然而泡沫的破滅就在頃刻之間,人工智能研究的第二個寒冬伴隨著個人消費電腦的快速崛起而到來。從1987年到1993年,短短6年時間,蘋果和IBM在PC市場的發力為人們帶來便捷計算工具的同時,卻為高昂的Lisp電腦帶來巨大的生存壓力。而后者作為人工智能硬件的基礎,它的破滅也阻擋了人工智能本身的發展。墻倒眾人推,研發節奏的緩慢導致質疑聲卷土重來,應用狹窄、知識系統建立困難、維護成本高昂等詬病壓得研究人員喘不過氣來。十年前日本提出的第五代計算機計劃也宣布失敗。AI遭遇了一系列財政問題,進入第二次低谷。
至此人工智能經歷兩起兩落,從初見雛形至此已經經過了快60年,“二十年內,機器將能完成人能做到的一切工作”的豪言壯語并沒有變成現實。然而中國有句古話叫“甲子一輪回”,跌跌撞撞的60年走來,人工智能在不斷的起伏中艱難前行。柳暗花明,人工智能的下一個60年開始變得豁然開朗。
1.1.3 新時代的人工智能
1965年,英特爾創始人之一戈登·摩爾(Gordon Moore)提出著名的摩爾定律—“當價格不變時,集成電路上可容納的元器件的數目約每隔18~24個月便會增加一倍,性能也將提升一倍”。這一定律揭示了信息技術進步的速度。關于人工智能第一次低谷的原因,其中之一便是當時落后的計算機運算能力,但在1990年后,算力已不再是阻擋人工智能騰飛的障礙。20世紀90年代開始,計算機處理器的性能更新程度越來越快,伴隨而至的人工智能也開始出現令人驚嘆的成就,掀起新一輪高潮,直到今時今日。其中有四次著名的人機大戰,從每一次比拼的變化中可以看到人工智能發展之迅猛讓人瞠目結舌。
第一場:1997年,美國IBM公司的“深藍”超級計算機挑戰博弈樹復雜度為10的123次方的國際象棋,以2勝1負3平戰勝了當時世界排名第一的國際象棋大師卡斯帕羅夫,引起世界范圍內的轟動(見圖1-8)。相較于卡斯帕羅夫可以預判10步,“深藍”依靠每秒可運算2億步的強大的計算能力,窮舉所有路數來選擇最佳策略,高下立判。

圖1-8 “深藍”大戰卡斯帕羅夫
第二場:2006年,浪潮天梭挑戰博弈樹復雜度為10的123次方的中國象棋,在比賽中,同時迎戰柳大華、張強、汪洋、徐天紅、樸風波5位大師。比賽按照2局制的規則進行,反復博弈后,浪潮天梭最終憑借每步66萬億次的棋位分析與檢索能力,發揮出平均每步棋27秒的速度,以11∶9的總比分取得勝利。從那場比賽開始,象棋軟件蓬勃發展,人類棋手逐漸難以與之抗衡。
第三場:2011年,“深藍”的同門師弟“沃森”在美國老牌智力問答節目《危險邊緣》中挑戰兩位人類冠軍。比賽過程中,“沃森”展現出驚人的自然語言理解能力,不但能夠準確識別題目內容,還能夠分析線索的微妙含義,并理解諷刺反語等深層次的表達方式,再加上它3秒內檢索數百萬條信息的運算速度,最終輕松戰勝兩位人類冠軍。
第四場:2016年,谷歌Deep Mind公司的深度學習AlphaGo挑戰世界冠軍韓國職業棋手李世石九段。這場比賽舉世矚目,博弈樹復雜度為10的360次方的圍棋一直被認為是人類最后的智力競技高地。據估算,圍棋的可能下法數量超越了可觀測宇宙范圍內的原子總數,顯然1997年的“深藍”式硬算在圍棋上行不通。正因如此,人們長久以來一直認為只有人類擅長下圍棋。但AlphaGo最終以4∶1戰勝李世石(見圖1-9)。更可怕的是,2016年到2017這個跨年夜,AlphaGo進階版Master在某圍棋網絡對戰平臺上挑戰中韓世界冠軍,留下超過60盤連勝零負的成績后絕塵而去,包括對當今世界圍旗第一人柯潔連勝三局。

圖1-9 AlphaGo對戰李世石
四場比賽,20年的時間,體現人類智慧的競技游戲,已被人工智能徹底占領高地,甚至有人戲稱李世石將是最后一個可以戰勝AI的棋手。與此相伴的是,人工智能在多個領域的全面繁榮成長。