财神8彩票网合法吗

書名：人工智能
作者名：騰訊研究院等
本章字?jǐn)?shù)： 922字
更新時(shí)間： 2019-01-02 21:01:58

第二章
人工智能的過(guò)去

人工智能的概念

提起人工智能，我們會(huì)想起在各類影視作品中看到的場(chǎng)景：《她》里讓人類陷入愛(ài)情的人工智能操作系統(tǒng)薩曼莎、《超能特工隊(duì)》里的充氣醫(yī)療機(jī)器人大白、《西部世界》里游蕩在公園里逐漸意識(shí)覺(jué)醒的機(jī)器人接待員等等，都是人們對(duì)人工智能的美好期待。

時(shí)間回到1956年的夏天，在達(dá)特茅斯夏季人工智能研究會(huì)議上，約翰·麥卡錫、馬文·明斯基、納撒尼爾·羅切斯特和克勞德·香農(nóng)，以及其余6位科學(xué)家，共同討論了當(dāng)時(shí)計(jì)算機(jī)科學(xué)領(lǐng)域尚未解決的問(wèn)題，第一次提出了人工智能的概念。在這次會(huì)議之后，人工智能開(kāi)始了第一春，但受限于當(dāng)時(shí)的軟硬件條件，那時(shí)的人工智能研究多局限于對(duì)于人類大腦運(yùn)行的模擬，研究者只能著眼于一些特定領(lǐng)域的具體問(wèn)題，出現(xiàn)了幾何定理證明器、西洋跳棋程序、積木機(jī)器人等。在那個(gè)計(jì)算機(jī)僅僅被作為數(shù)值計(jì)算器的時(shí)代，這些略微展現(xiàn)出智能的應(yīng)用，即被視作人工智能的體現(xiàn)。

進(jìn)入21世紀(jì)，隨著深度學(xué)習(xí)的提出，人工智能又一次掀起浪潮。小到手機(jī)里的Apple Siri，大到城市里的智慧安防，層出不窮的應(yīng)用出現(xiàn)在論文里、新聞里以及人們的日常生活中。而其中最稱得上里程碑事件的是，2016年由谷歌旗下DeepMind公司開(kāi)發(fā)的AlphaGo，在與圍棋世界冠軍、職業(yè)九段棋手李世石進(jìn)行的圍棋人機(jī)大戰(zhàn)中，以4比1的總比分獲勝。這一刻，即使是之前對(duì)人工智能一無(wú)所知的人，也終于開(kāi)始感受到它的力量。

雖然人工智能技術(shù)在近幾年取得了高速的發(fā)展，但要給人工智能下個(gè)準(zhǔn)確的定義并不容易。一般認(rèn)為，人工智能是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人類日常生活中的許多活動(dòng)，如數(shù)學(xué)計(jì)算、觀察、對(duì)話、學(xué)習(xí)等，都需要“智能”。“智能”能預(yù)測(cè)股票、看得懂圖片或視頻，也能和其他人進(jìn)行文字或語(yǔ)言上的交流，不斷督促自我完善知識(shí)儲(chǔ)備，它會(huì)畫畫，會(huì)寫詩(shī)，會(huì)駕駛汽車，會(huì)開(kāi)飛機(jī)。在人們的理想中，如果機(jī)器能夠執(zhí)行這些任務(wù)中的一種或幾種，就可以認(rèn)為該機(jī)器已具有某種性質(zhì)的“人工智能”。時(shí)至今日，人工智能概念的內(nèi)涵已經(jīng)被大大擴(kuò)展，它涵蓋了計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、腦神經(jīng)學(xué)、社會(huì)科學(xué)等諸多領(lǐng)域，是一門交叉學(xué)科。人們希望通過(guò)對(duì)人工智能的研究，能將它用于模擬和擴(kuò)展人的智能，輔助甚至代替人們實(shí)現(xiàn)多種功能，包括識(shí)別、認(rèn)知、分析、決策等等。

人工智能的層次

如果要結(jié)構(gòu)化地表述人工智能的話，從下往上依次是基礎(chǔ)設(shè)施層、算法層、技術(shù)層、應(yīng)用層（見(jiàn)圖1-16）。基礎(chǔ)設(shè)施包括硬件/計(jì)算能力和大數(shù)據(jù)；算法層包括各類機(jī)器學(xué)習(xí)算法、深度學(xué)習(xí)算法等；再往上是多個(gè)技術(shù)方向，包括賦予計(jì)算機(jī)感知/分析能力的計(jì)算機(jī)視覺(jué)技術(shù)和語(yǔ)音技術(shù)、提供理解/思考能力的自然語(yǔ)言處理技術(shù)、提供決策/交互能力的規(guī)劃決策系統(tǒng)和大數(shù)據(jù)/統(tǒng)計(jì)分析技術(shù)。每個(gè)技術(shù)方向下又有多個(gè)具體子技術(shù)；最頂層的是行業(yè)解決方案，目前比較成熟的包括金融、安防、交通、醫(yī)療、游戲等。

圖1-16 人工智能的層次結(jié)構(gòu)

基礎(chǔ)設(shè)施層

回顧人工智能發(fā)展史，每次基礎(chǔ)設(shè)施的發(fā)展都顯著地推動(dòng)了算法層和技術(shù)層的演進(jìn)。從20世紀(jì)70年代的計(jì)算機(jī)興起、80年代的計(jì)算機(jī)普及，到90年代計(jì)算機(jī)運(yùn)算速度和存儲(chǔ)量的增加、互聯(lián)網(wǎng)興起帶來(lái)的數(shù)據(jù)電子化，均產(chǎn)生了較大的推動(dòng)作用。而到了21世紀(jì)，這種推動(dòng)效果則更為顯著，互聯(lián)網(wǎng)大規(guī)模服務(wù)集群的出現(xiàn)、搜索和電商業(yè)務(wù)帶來(lái)的大數(shù)據(jù)積累、GPU（圖形處理器）和異構(gòu)/低功耗芯片興起帶來(lái)的運(yùn)算力提升，促成了深度學(xué)習(xí)的誕生，點(diǎn)燃了人工智能的這一波爆發(fā)浪潮。

這波浪潮之中，數(shù)據(jù)的爆發(fā)增長(zhǎng)功不可沒(méi)。我們知道，海量的訓(xùn)練數(shù)據(jù)是人工智能發(fā)展的重要燃料，數(shù)據(jù)的規(guī)模和豐富度對(duì)算法訓(xùn)練尤為重要。如果我們把人工智能看成一個(gè)剛出生的嬰兒，某一領(lǐng)域?qū)I(yè)的、海量的、深度的數(shù)據(jù)就是喂養(yǎng)這個(gè)天才的奶粉。奶粉的數(shù)量決定了嬰兒是否能長(zhǎng)大，而奶粉的質(zhì)量則決定了嬰兒后續(xù)的智力發(fā)育水平。2000年以來(lái)，得益于互聯(lián)網(wǎng)、社交媒體、移動(dòng)設(shè)備和傳感器的普及，全球產(chǎn)生及存儲(chǔ)的數(shù)據(jù)量劇增。根據(jù)IDC報(bào)告顯示，2020年全球數(shù)據(jù)總量預(yù)計(jì)將超過(guò)40ZB（相當(dāng)于4萬(wàn)億G） Gantz, John, Reinsel, David. IDC Study:Digital Universe in 2020,2012. ，這一數(shù)據(jù)量是2011年的22倍（見(jiàn)圖1-17）。在過(guò)去幾年，全球的數(shù)據(jù)量以每年58%的速度增長(zhǎng)，在未來(lái)這個(gè)速度將會(huì)更快。與之前相比，現(xiàn)階段“數(shù)據(jù)”包含的信息量越來(lái)越大、維度越來(lái)越多，從簡(jiǎn)單的文本、圖像、聲音等數(shù)據(jù)，到動(dòng)作、姿態(tài)、軌跡等人類行為數(shù)據(jù)，再到地理位置、天氣等環(huán)境數(shù)據(jù)。有了規(guī)模更大、類型更豐富的數(shù)據(jù)，模型效果自然也能得到提升。

圖1-17 2005—2020年全球總體數(shù)據(jù)量

而在另一方面，運(yùn)算力的提升也起到了明顯效果。AI芯片的出現(xiàn)顯著提高了數(shù)據(jù)處理速度，尤其在處理海量數(shù)據(jù)時(shí)明顯優(yōu)于傳統(tǒng)CPU。在擅長(zhǎng)處理/控制和復(fù)雜流程但高功耗的CPU的基礎(chǔ)之上，誕生了擅長(zhǎng)并行計(jì)算的GPU，以及擁有良好運(yùn)行能效比、更適合深度學(xué)習(xí)模型的FPGA和ASIC。芯片的功耗比越來(lái)越高，而靈活性則越來(lái)越低，甚至可以是為特定功能的深度學(xué)習(xí)算法量身定做的（見(jiàn)圖1-18）。

圖1-18 不同類型芯片運(yùn)算能力、功耗對(duì)比

算法層

說(shuō)到算法層，必須先明確幾個(gè)概念。所謂“機(jī)器學(xué)習(xí)”，是指利用算法使計(jì)算機(jī)能夠像人一樣從數(shù)據(jù)中挖掘出信息；而“深度學(xué)習(xí)”作為“機(jī)器學(xué)習(xí)”的一個(gè)子集，相比其他學(xué)習(xí)方法，使用了更多的參數(shù)、模型也更復(fù)雜，從而使得模型對(duì)數(shù)據(jù)的理解更加深入，也更加智能。傳統(tǒng)機(jī)器學(xué)習(xí)是分步驟來(lái)進(jìn)行的，每一步的最優(yōu)解不一定帶來(lái)結(jié)果的最優(yōu)解；另一方面，手工選取特征是一種費(fèi)時(shí)費(fèi)力且需要專業(yè)知識(shí)的方法，很大程度上依賴經(jīng)驗(yàn)和運(yùn)氣。而深度學(xué)習(xí)是從原始特征出發(fā)，自動(dòng)學(xué)習(xí)高級(jí)特征組合，整個(gè)過(guò)程是端到端的，直接保證最終輸出的是最優(yōu)解。但中間的隱層是一個(gè)黑箱，我們并不知道機(jī)器提取出了什么特征（見(jiàn)圖1-19）。

圖1-19 深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的差別

機(jī)器學(xué)習(xí)中會(huì)碰到以下幾類典型問(wèn)題（見(jiàn)圖1-20）。第一類是無(wú)監(jiān)督學(xué)習(xí)問(wèn)題：給定數(shù)據(jù)，從數(shù)據(jù)中發(fā)現(xiàn)信息。它的輸入是沒(méi)有維度標(biāo)簽的歷史數(shù)據(jù)，要求的輸出是聚類后的數(shù)據(jù)。比如給定一籃水果，要求機(jī)器自動(dòng)將其中的同類水果歸在一起。機(jī)器會(huì)怎么做呢？首先對(duì)籃子里的每個(gè)水果都用一個(gè)向量來(lái)表示，比如顏色、味道、形狀。然后將相似向量（向量距離比較近）的水果歸為一類，紅色、甜的、圓形的被劃在了一類，黃色、甜的、條形的被劃在了另一類。人類跑過(guò)來(lái)一看，原來(lái)第一類里的都是蘋果，第二類里的都是香蕉呀。這就是無(wú)監(jiān)督學(xué)習(xí)，典型的應(yīng)用場(chǎng)景是用戶聚類、新聞聚類等。

圖1-20 機(jī)器學(xué)習(xí)中的三類典型問(wèn)題

第二類是監(jiān)督學(xué)習(xí)問(wèn)題：給定數(shù)據(jù)，預(yù)測(cè)這些數(shù)據(jù)的標(biāo)簽。它的輸出是帶維度標(biāo)簽的歷史數(shù)據(jù)，要求的輸出是依據(jù)模型所做出的預(yù)測(cè)。比如給定一籃水果，其中不同的水果都貼上了水果名的標(biāo)簽，要求機(jī)器從中學(xué)習(xí)，然后對(duì)一個(gè)新的水果預(yù)測(cè)其標(biāo)簽名。機(jī)器還是對(duì)每個(gè)水果進(jìn)行了向量表示，根據(jù)水果名的標(biāo)簽，機(jī)器通過(guò)學(xué)習(xí)發(fā)現(xiàn)紅色、甜的、圓形的對(duì)應(yīng)的是蘋果，黃色、甜的、條形的對(duì)應(yīng)的是香蕉。于是，對(duì)于一個(gè)新的水果，機(jī)器按照這個(gè)水果的向量表示知道了它是蘋果還是香蕉。監(jiān)督學(xué)習(xí)典型的應(yīng)用場(chǎng)景是推薦、預(yù)測(cè)相關(guān)的問(wèn)題。

第三類是強(qiáng)化學(xué)習(xí)問(wèn)題：給定數(shù)據(jù)，選擇動(dòng)作以最大化長(zhǎng)期獎(jiǎng)勵(lì)。它的輸入是歷史的狀態(tài)、動(dòng)作和對(duì)應(yīng)獎(jiǎng)勵(lì)，要求輸出的是當(dāng)前狀態(tài)下的最佳動(dòng)作。與前兩類問(wèn)題不同的是，強(qiáng)化學(xué)習(xí)是一個(gè)動(dòng)態(tài)的學(xué)習(xí)過(guò)程，而且沒(méi)有明確的學(xué)習(xí)目標(biāo)，對(duì)結(jié)果也沒(méi)有精確的衡量標(biāo)準(zhǔn)。強(qiáng)化學(xué)習(xí)作為一個(gè)序列決策問(wèn)題，就是計(jì)算機(jī)連續(xù)選擇一些行為，在沒(méi)有任何維度標(biāo)簽告訴計(jì)算機(jī)應(yīng)怎么做的情況下，計(jì)算機(jī)先嘗試做出一些行為，然后得到一個(gè)結(jié)果，通過(guò)判斷這個(gè)結(jié)果是對(duì)還是錯(cuò)，來(lái)對(duì)之前的行為進(jìn)行反饋。舉個(gè)例子來(lái)說(shuō)，假設(shè)在午飯時(shí)間你要下樓吃飯，附近的餐廳你已經(jīng)體驗(yàn)過(guò)一部分，但不是全部，你可以在已經(jīng)嘗試過(guò)的餐館中選一家最好的（開(kāi)發(fā)，exploitation），也可以嘗試一家新的餐館（探索，exploration），后者可能讓你發(fā)現(xiàn)新的更好的餐館，也可能吃到不滿意的一餐。而當(dāng)你已經(jīng)嘗試過(guò)的餐廳足夠多的時(shí)候，你會(huì)總結(jié)出經(jīng)驗(yàn)（“大眾點(diǎn)評(píng)”上的高分餐廳一般不會(huì)太差；公司樓下近的餐廳沒(méi)有遠(yuǎn)的餐廳好吃，等等），這些經(jīng)驗(yàn)會(huì)幫助你更好地發(fā)現(xiàn)靠譜的餐館。許多控制決策類的問(wèn)題都是強(qiáng)化學(xué)習(xí)問(wèn)題，比如讓機(jī)器通過(guò)各種參數(shù)調(diào)整來(lái)控制無(wú)人機(jī)實(shí)現(xiàn)穩(wěn)定飛行，通過(guò)各種按鍵操作在電腦游戲中贏得分?jǐn)?shù)等。

機(jī)器學(xué)習(xí)算法中的一個(gè)重要分支是神經(jīng)網(wǎng)絡(luò)算法。雖然直到21世紀(jì)才因?yàn)锳lphaGo的勝利而為人們所熟知，但神經(jīng)網(wǎng)絡(luò)的歷史至少可以追溯到60年前。60年來(lái)神經(jīng)網(wǎng)絡(luò)幾經(jīng)起落，由于各個(gè)時(shí)代背景下數(shù)據(jù)、硬件、運(yùn)算力等的種種限制，一次次因遭遇瓶頸而被冷落，又一次次取得突破重新回到人們的視野中，最近的一次是隨著深度學(xué)習(xí)的興起而備受關(guān)注。

從20世紀(jì)40年代起，就有學(xué)者開(kāi)始從事神經(jīng)網(wǎng)絡(luò)的研究：McCulloch和Pitts發(fā)布了A Logical Calculus of the Ideas Immanent in Nervous Activity McCulloch, Warren, Walter Pitts. A Logical Calculus of the Ideas Immanent in Nervous Activity. Bulletin of Mathematical Biophysics,1943,5（4）:115-133. ，被認(rèn)為是神經(jīng)網(wǎng)絡(luò)的第一篇文章；神經(jīng)心理學(xué)家Hebb出版了The Organization of Behavior Hebb, Donald. The Organization of Behavior. New York:Wiley,1949. 一書，在書中提出了被后人稱為“Hebb規(guī)則”的學(xué)習(xí)機(jī)制。第一個(gè)大突破出現(xiàn)于1958年，Rosenblatt在計(jì)算機(jī)上模擬實(shí)現(xiàn)了一種他發(fā)明的叫作“感知機(jī)”（Perceptron）的模型 Rosenblatt, F. The Perceptron:A Probabilistic Model for Information Storage and Organization in the Brain. Psychological Review,1958,65（6）:386-408. ，這個(gè)模型可以完成一些簡(jiǎn)單的視覺(jué)處理任務(wù)，也是后來(lái)神經(jīng)網(wǎng)絡(luò)的雛形、支持向量機(jī)（一種快速可靠的分類算法）的基礎(chǔ)（見(jiàn)圖1-21）。一時(shí)間，這種能夠模擬人腦的算法得到了人們的廣泛追捧，國(guó)防部等政府機(jī)構(gòu)紛紛開(kāi)始贊助神經(jīng)網(wǎng)絡(luò)的研究。神經(jīng)網(wǎng)絡(luò)的風(fēng)光持續(xù)了十余年，1969年，Minsky等人論證了感知機(jī)在解決XOR（異或）等基本邏輯問(wèn)題時(shí)能力有限 Minsky, Marvin, Papert, Seymour. Perceptrons:An Introduction to Computational Geometry. MIT Press,1969. ，這一缺陷的展現(xiàn)澆滅了人們對(duì)神經(jīng)網(wǎng)絡(luò)的熱情，原來(lái)的政府機(jī)構(gòu)也逐漸停止資助，直接造成了此后長(zhǎng)達(dá)10年的神經(jīng)網(wǎng)絡(luò)的“冷靜時(shí)期”。期間，Werbos在1974年證明了在神經(jīng)網(wǎng)絡(luò)中多加一層 Paul Werbos. Beyond regression:New tools for prediction and analysis in the behavioral sciences. PhD thesis, Harvard University,1974. ，并且利用“后向傳播”（Back-propagation）算法可以有效解決XOR問(wèn)題，但由于當(dāng)時(shí)仍處于神經(jīng)網(wǎng)絡(luò)的低潮，這一成果并沒(méi)有得到太多關(guān)注。

圖1-21 感知機(jī)模型圖示

直到80年代，神經(jīng)網(wǎng)絡(luò)才終于迎來(lái)復(fù)興。物理學(xué)家Hopfield在1982年和1984年發(fā)表了兩篇關(guān)于人工神經(jīng)網(wǎng)絡(luò)研究的論文，提出了一種新的神經(jīng)網(wǎng)絡(luò)，可以解決一大類模式識(shí)別問(wèn)題，還可以給出一類組合優(yōu)化問(wèn)題的近似解。他的研究引起了巨大的反響，人們重新認(rèn)識(shí)到神經(jīng)網(wǎng)絡(luò)的威力以及付諸應(yīng)用的現(xiàn)實(shí)性。1985年，Rumelhart、Hinton等許多神經(jīng)網(wǎng)絡(luò)學(xué)者成功實(shí)現(xiàn)了使用“后向傳播”BP算法來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò) Rumelhart, David E., Hinton, Geoffrey E., Williams, Ronald J. Learning representations by back-propagating errors. Nature,1985,323（6088）:533-536. ，并在很長(zhǎng)一段時(shí)間內(nèi)將BP作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練的專用算法。在這之后，越來(lái)越多的研究成果開(kāi)始涌現(xiàn)。1995年，Yann LeCun等人受生物視覺(jué)模型的啟發(fā)，改進(jìn)了卷積神經(jīng)網(wǎng)絡(luò)（Convolution Neural Network, CNN）（見(jiàn)圖1-22）。 Bengio, Y., Lecun, Y. Convolutional networks for images, speech, and time-series,1995. 這個(gè)網(wǎng)絡(luò)模擬了視覺(jué)皮層中的細(xì)胞（有小部分細(xì)胞對(duì)特定部分的視覺(jué)區(qū)域敏感，個(gè)體神經(jīng)細(xì)胞只有在特定方向的邊緣存在時(shí)才能做出反應(yīng)），以類似的方式計(jì)算機(jī)能夠進(jìn)行圖像分類任務(wù)（通過(guò)尋找低層次的簡(jiǎn)單特征，如邊緣和曲線，然后運(yùn)用一系列的卷積層建立一個(gè)更抽象的概念），在手寫識(shí)別等小規(guī)模問(wèn)題上取得了當(dāng)時(shí)的最好結(jié)果。2000年之后，Bengio等人開(kāi)創(chuàng)了神經(jīng)網(wǎng)絡(luò)構(gòu)建語(yǔ)言模型的先河。 Bengio, Y., Vincent, P., Janvin, C. A neural probabilistic language model. Journal of Machine Learning Research,2003,3（6）,1137-1155.

圖1-22 卷積神經(jīng)網(wǎng)絡(luò)（CNN）圖示

直到2001年，Hochreiter等人發(fā)現(xiàn)使用BP算法時(shí)，在神經(jīng)網(wǎng)絡(luò)單元飽和之后會(huì)發(fā)生梯度損失 Hochreiter, S., et al. Gradient flow in recurrent nets:the difficulty of learning long-term dependencies//Kolen, John F., Kremer, Stefan C. A Field Guide to Dynamical Recurrent Networks. John Wiley &Sons,2001. ，即模型訓(xùn)練超過(guò)一定迭代次數(shù)后容易產(chǎn)生過(guò)擬合，就是訓(xùn)練集和測(cè)試集數(shù)據(jù)分布不一致（就好比上學(xué)考試的時(shí)候，有的人采取題海戰(zhàn)術(shù)，把每道題目都背下來(lái)。但是題目稍微一變，他就不會(huì)做了。因?yàn)闄C(jī)器非常復(fù)雜地記住了每道題的做法，卻沒(méi)有抽象出通用的規(guī)則）。神經(jīng)網(wǎng)絡(luò)又一次被人們所遺棄。然而，神經(jīng)網(wǎng)絡(luò)并未就此沉寂，許多學(xué)者仍在堅(jiān)持不懈地進(jìn)行研究。2006年，Hinton和他的學(xué)生在Science雜志上發(fā)表了一篇文章 Hinton, Geoffrey, Salakhutdinov, Ruslan. Reducing the Dimensionality of Data with Neural Networks. Science,2006（313）:504-507. ，從此掀起了深度學(xué)習(xí)（Deep Learning）的浪潮。深度學(xué)習(xí)能發(fā)現(xiàn)大數(shù)據(jù)中的復(fù)雜結(jié)構(gòu)，也因此大幅提升了神經(jīng)網(wǎng)絡(luò)的效果。2009年開(kāi)始，微軟研究院和Hinton合作研究基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別 NIPS Workshop:Deep Learning for Speech Recognition and Related Applications, Whistler, BC, Canada, Dec. 2009（Organizers:Li Deng, Geoff Hinton, D. Yu）. ，使得相對(duì)誤識(shí)別率降低25%。2012年，Hinton又帶領(lǐng)學(xué)生在目前最大的圖像數(shù)據(jù)庫(kù)ImageNet上，對(duì)分類問(wèn)題取得了驚人成果，將Top5錯(cuò)誤率由26%降低至15%。 Krizhevsky, Alex, Sutskever, Ilya, Hinton, Geoffry. Image Net Classification with Deep Convolutional Neural Networks（PDF）.NIPS 2012:Neural Information Processing Systems, Lake Tahoe, Nevada,2012. 再往后的一個(gè)標(biāo)志性時(shí)間是2014年，Ian Goodfellow等學(xué)者發(fā)表論文提出題目中的“生成對(duì)抗網(wǎng)絡(luò)” Goodfellow, Ian J., Pouget-Abadie, Jean, Mirza, Mehdi, Xu, Bing, Warde-Farley, David, Ozair, Sherjil, Courville, Aaron, Bengio，Yoshua. Generative Adversarial Networks,2014. ，標(biāo)志著GANs的誕生，并自2016年開(kāi)始成為學(xué)界、業(yè)界炙手可熱的概念，它為創(chuàng)建無(wú)監(jiān)督學(xué)習(xí)模型提供了強(qiáng)有力的算法框架。時(shí)至今日，神經(jīng)網(wǎng)絡(luò)經(jīng)歷了數(shù)次潮起潮落后，又一次站在了風(fēng)口浪尖，在圖像識(shí)別、語(yǔ)音識(shí)別、機(jī)器翻譯等領(lǐng)域，都隨處可見(jiàn)它的身影（見(jiàn)圖1-23）。

圖1-23 神經(jīng)網(wǎng)絡(luò)發(fā)展簡(jiǎn)史

而其他淺層學(xué)習(xí)的算法，也在另一條路線上不斷發(fā)展著，甚至一度取代神經(jīng)網(wǎng)絡(luò)成為人們最青睞的算法。直到今天，即使神經(jīng)網(wǎng)絡(luò)的發(fā)展如日中天，這些淺層算法也在一些任務(wù)中占有一席之地。

1984年，Breiman和Friedman提出決策樹(shù)算法 Breiman, Leo, Friedman, J. H., Olshen, R. A., Stone, C. J. Classification and regression trees. Monterey, CA: Wadsworth &Brooks/Cole Advanced Books &Software,1984. ，作為一個(gè)預(yù)測(cè)模型，代表的是對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系。1995年，Vapnik和Cortes提出支持向量機(jī)（SVM） Cortes, C., Vapnik, V. Support-vector networks.Machine Learning,1995,20（3）:273-297. ，用一個(gè)分類超平面將樣本分開(kāi)從而達(dá)到分類效果（見(jiàn)圖1-24）。這種監(jiān)督式學(xué)習(xí)的方法，可廣泛地應(yīng)用于統(tǒng)計(jì)分類以及回歸分析。鑒于SVM強(qiáng)大的理論地位和實(shí)證結(jié)果，機(jī)器學(xué)習(xí)研究也自此分為神經(jīng)網(wǎng)絡(luò)和SVM兩派。1997年，F(xiàn)reund和Schapire提出了另一個(gè)堅(jiān)實(shí)的ML模型AdaBoost Freund, Yoav, Schapire, Robert E. A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer and System Sciences,1997（55）:119. ，該算法最大的特點(diǎn)在于組合弱分類器形成強(qiáng)分類器，在臉部識(shí)別和檢測(cè)方面應(yīng)用很廣。2001年，Breiman提出可以將多個(gè)決策樹(shù)組合成為隨機(jī)森林 Breiman, Leo. Random Forests. Machine Learning,2001,45（1）:5-32. ，它可以處理大量輸入變量，學(xué)習(xí)過(guò)程快，準(zhǔn)確度高（見(jiàn)圖1-25）。隨著該方法的提出，SVM在許多之前由神經(jīng)網(wǎng)絡(luò)占據(jù)的任務(wù)中獲得了更好的效果，神經(jīng)網(wǎng)絡(luò)已無(wú)力和SVM競(jìng)爭(zhēng)。之后雖然深度學(xué)習(xí)的興起給神經(jīng)網(wǎng)絡(luò)帶來(lái)了第二春，使其在圖像、語(yǔ)音、NLP等領(lǐng)域都取得了領(lǐng)先成果，但這并不意味著其他機(jī)器學(xué)習(xí)流派的終結(jié)。深度神經(jīng)網(wǎng)絡(luò)所需的訓(xùn)練成本、調(diào)參復(fù)雜度等問(wèn)題仍備受詬病，SVM則因其簡(jiǎn)單性占據(jù)了一席之地，在文本處理、圖像處理、網(wǎng)頁(yè)搜索、金融征信等領(lǐng)域仍有著廣泛應(yīng)用。

圖1-24 支持向量機(jī)（SVM）圖示

圖1-25 淺層學(xué)習(xí)算法發(fā)展歷史

另一個(gè)重要領(lǐng)域是強(qiáng)化學(xué)習(xí)，這個(gè)因AlphaGo而為人所熟知的概念，從60年代誕生以來(lái)，一直不溫不火地發(fā)展著，直到在AlphaGo中與深度學(xué)習(xí)的創(chuàng)造性結(jié)合讓它重獲新生。

1967年，Samuel發(fā)明的下棋程序是強(qiáng)化學(xué)習(xí)的最早應(yīng)用雛形。但在六七十年代，人們對(duì)強(qiáng)化學(xué)習(xí)的研究與監(jiān)督學(xué)習(xí)、模式識(shí)別等問(wèn)題混淆在一起，導(dǎo)致進(jìn)展緩慢。進(jìn)入80年代后，隨著對(duì)神經(jīng)網(wǎng)絡(luò)的研究取得進(jìn)展以及基礎(chǔ)設(shè)施的完善，強(qiáng)化學(xué)習(xí)的研究再現(xiàn)高潮。1983年，Barto通過(guò)強(qiáng)化學(xué)習(xí)使倒立擺維持了較長(zhǎng)時(shí)間。另一位強(qiáng)化學(xué)習(xí)大牛Sutton也提出了強(qiáng)化學(xué)習(xí)的幾個(gè)主要算法，包括1984年提出的AHC算法 Sutton, Richard S. Temporal Credit Assignment in Reinforcement Learning（PhD thesis）. University of Massachusetts, Amherst, MA,1984. ，之后又在1988年提出TD方法 Sutton, Richard S. Learning to predict by the method of temporal differences. Machine Learning,1988（3）:9-44. 。1989年，Watkins提出著名的Q-learning算法。 Watkins, Christopher J. C. H. Learning from Delayed Rewards（PDF）（PhD thesis）. King's College, Cambridge, UK,1989. 隨著幾個(gè)重要算法被提出，到了90年代，強(qiáng)化學(xué)習(xí)已逐漸發(fā)展成為機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)重要組成部分。

最新也是最大的一個(gè)里程碑事件出現(xiàn)在2016年，谷歌旗下DeepMind公司的David Silver創(chuàng)新性地將深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合在了一起，打造出圍棋軟件AlphaGo，接連戰(zhàn)勝李世石、柯潔等一眾世界圍棋冠軍，展現(xiàn)了強(qiáng)化學(xué)習(xí)的巨大威力（見(jiàn)圖1-26）。

圖1-26 強(qiáng)化學(xué)習(xí)算法發(fā)展歷史

技術(shù)方向的發(fā)展

計(jì)算機(jī)視覺(jué)

“看”是人類與生俱來(lái)的能力。剛出生的嬰兒只需要幾天的時(shí)間就能學(xué)會(huì)模仿父母的表情，人們能從復(fù)雜結(jié)構(gòu)的圖片中找到關(guān)注重點(diǎn)、在昏暗的環(huán)境下認(rèn)出熟人。隨著人工智能的發(fā)展，機(jī)器也試圖在這項(xiàng)能力上匹敵甚至超越人類。

計(jì)算機(jī)視覺(jué)的歷史可以追溯到1966年，人工智能學(xué)家Minsky在給學(xué)生布置的作業(yè)中，要求學(xué)生通過(guò)編寫一個(gè)程序讓計(jì)算機(jī)告訴我們它通過(guò)攝像頭看到了什么，這也被認(rèn)為是計(jì)算機(jī)視覺(jué)最早的任務(wù)描述。到了七八十年代，隨著現(xiàn)代電子計(jì)算機(jī)的出現(xiàn)，計(jì)算機(jī)視覺(jué)技術(shù)也初步萌芽。人們開(kāi)始嘗試讓計(jì)算機(jī)回答出它看到了什么東西，于是首先想到的是從人類看東西的方法中獲得借鑒。借鑒之一是當(dāng)時(shí)人們普遍認(rèn)為，人類能看到并理解事物，是因?yàn)槿祟愅ㄟ^(guò)兩只眼睛可以立體地觀察事物。因此要想讓計(jì)算機(jī)理解它所看到的圖像，必須先將事物的三維結(jié)構(gòu)從二維的圖像中恢復(fù)出來(lái)，這就是所謂的“三維重構(gòu)”的方法。借鑒之二是人們認(rèn)為人之所以能識(shí)別出一個(gè)蘋果，是因?yàn)槿藗円呀?jīng)知道了蘋果的先驗(yàn)知識(shí)，比如蘋果是紅色的、圓的、表面光滑的，如果給機(jī)器也建立一個(gè)這樣的知識(shí)庫(kù)，讓機(jī)器將看到的圖像與庫(kù)里的儲(chǔ)備知識(shí)進(jìn)行匹配，是否可以讓機(jī)器識(shí)別乃至理解它所看到的東西呢，這是所謂的“先驗(yàn)知識(shí)庫(kù)”的方法。這一階段的應(yīng)用主要是一些光學(xué)字符識(shí)別、工件識(shí)別、顯微/航空?qǐng)D片的識(shí)別等等。

到了90年代，計(jì)算機(jī)視覺(jué)技術(shù)取得了更大的發(fā)展，也開(kāi)始廣泛應(yīng)用于工業(yè)領(lǐng)域。一方面是由于GPU、DSP等圖像處理硬件技術(shù)有了飛速進(jìn)步；另一方面是人們也開(kāi)始嘗試不同的算法，包括統(tǒng)計(jì)方法和局部特征描述符的引入。在“先驗(yàn)知識(shí)庫(kù)”的方法中，事物的形狀、顏色、表面紋理等特征受到視角和觀察環(huán)境的影響，在不同角度、不同光線、不同遮擋的情況下會(huì)產(chǎn)生變化。因此，人們找到了一種方法，通過(guò)局部特征的識(shí)別來(lái)判斷事物，通過(guò)對(duì)事物建立一個(gè)局部特征索引，即使視角或觀察環(huán)境發(fā)生變化，也能比較準(zhǔn)確地匹配上（見(jiàn)圖1-27）。

圖1-27 基于局部特征識(shí)別的計(jì)算機(jī)視覺(jué)技術(shù)

進(jìn)入21世紀(jì)，得益于互聯(lián)網(wǎng)興起和數(shù)碼相機(jī)出現(xiàn)帶來(lái)的海量數(shù)據(jù)，加之機(jī)器學(xué)習(xí)方法的廣泛應(yīng)用，計(jì)算機(jī)視覺(jué)發(fā)展迅速。以往許多基于規(guī)則的處理方式，都被機(jī)器學(xué)習(xí)所替代，自動(dòng)從海量數(shù)據(jù)中總結(jié)歸納物體的特征，然后進(jìn)行識(shí)別和判斷。這一階段涌現(xiàn)出了非常多的應(yīng)用，包括典型的相機(jī)人臉檢測(cè)、安防人臉識(shí)別、車牌識(shí)別等等。數(shù)據(jù)的積累還誕生了許多評(píng)測(cè)數(shù)據(jù)集，比如權(quán)威的人臉識(shí)別和人臉比對(duì)識(shí)別的平臺(tái)——FDDB和LFW等，其中最有影響力的是ImageNet，包含1400萬(wàn)張已標(biāo)注的圖片，劃分在上萬(wàn)個(gè)類別里。

到了2010年以后，借助于深度學(xué)習(xí)的力量，計(jì)算機(jī)視覺(jué)技術(shù)得到了爆發(fā)增長(zhǎng)，實(shí)現(xiàn)了產(chǎn)業(yè)化。通過(guò)深度神經(jīng)網(wǎng)絡(luò)，各類視覺(jué)相關(guān)任務(wù)的識(shí)別精度都得到了大幅提升。在全球最權(quán)威的計(jì)算機(jī)視覺(jué)競(jìng)賽ILSVR（ImageNet Large Scale Visual Recognition Competition）上，千類物體識(shí)別Top-5錯(cuò)誤率在2010年和2011年時(shí)分別為28.2%和25.8%，從2012年引入深度學(xué)習(xí)之后，后續(xù)4年分別為16.4%、11.7%、6.7%、3.7%，出現(xiàn)了顯著突破。由于效果的提升，計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用場(chǎng)景也快速擴(kuò)展，除了在比較成熟的安防領(lǐng)域應(yīng)用外，也應(yīng)用于金融領(lǐng)域的人臉識(shí)別身份驗(yàn)證、電商領(lǐng)域的商品拍照搜索、醫(yī)療領(lǐng)域的智能影像診斷、機(jī)器人/無(wú)人車上作為視覺(jué)輸入系統(tǒng)等，包括許多有意思的場(chǎng)景：照片自動(dòng)分類（圖像識(shí)別+分類）、圖像描述生成（圖像識(shí)別+理解）等等（見(jiàn)圖1-28）。

圖1-28 計(jì)算機(jī)視覺(jué)發(fā)展歷程

語(yǔ)音技術(shù)

語(yǔ)言交流是人類最直接最簡(jiǎn)潔的交流方式。長(zhǎng)久以來(lái)，讓機(jī)器學(xué)會(huì)“聽(tīng)”和“說(shuō)”，實(shí)現(xiàn)與人類的無(wú)障礙交流一直是人工智能、人機(jī)交互領(lǐng)域的一大夢(mèng)想。

早在電子計(jì)算機(jī)出現(xiàn)之前，人們就有了讓機(jī)器識(shí)別語(yǔ)音的夢(mèng)想。1920年生產(chǎn)的“Radio Rex”玩具狗可能是世界上最早的語(yǔ)音識(shí)別器，當(dāng)有人喊“Rex”的時(shí)候，這只狗能夠從底座上彈出來(lái)（見(jiàn)圖1-29）。但實(shí)際上它所用到的技術(shù)并不是真正的語(yǔ)音識(shí)別，而是通過(guò)一個(gè)彈簧，這個(gè)彈簧在接收到500赫茲的聲音時(shí)會(huì)自動(dòng)釋放，而500赫茲恰好是人們喊出“Rex”中元音的第一個(gè)共振峰。第一個(gè)真正基于電子計(jì)算機(jī)的語(yǔ)音識(shí)別系統(tǒng)出現(xiàn)在1952年，AT&T貝爾實(shí)驗(yàn)室開(kāi)發(fā)了一款名為Audrey的語(yǔ)音識(shí)別系統(tǒng)，能夠識(shí)別10個(gè)英文數(shù)字，正確率高達(dá)98%。70年代開(kāi)始出現(xiàn)了大規(guī)模的語(yǔ)音識(shí)別研究，但當(dāng)時(shí)的技術(shù)還處于萌芽階段，停留在對(duì)孤立詞、小詞匯量句子的識(shí)別上。

圖1-29 “Radio Rex”玩具狗

80年代是技術(shù)取得突破的時(shí)代，一個(gè)重要原因是全球性的電傳業(yè)務(wù)積累了大量文本，這些文本可作為機(jī)讀語(yǔ)料用于模型的訓(xùn)練和統(tǒng)計(jì)。研究的重點(diǎn)也逐漸轉(zhuǎn)向大詞匯量、非特定人的連續(xù)語(yǔ)音識(shí)別。那時(shí)最主要的變化來(lái)自用基于統(tǒng)計(jì)的思路替代傳統(tǒng)的基于匹配的思路，其中的一個(gè)關(guān)鍵進(jìn)展是隱馬爾科夫模型（HMM）的理論和應(yīng)用都趨于完善。工業(yè)界也出現(xiàn)了廣泛的應(yīng)用，德州儀器研發(fā)了名為Speak & Spell語(yǔ)音學(xué)習(xí)機(jī)，語(yǔ)音識(shí)別服務(wù)商Speech Works成立，美國(guó)國(guó)防部高級(jí)研究計(jì)劃局（DARPA）也贊助支持了一系列語(yǔ)音相關(guān)的項(xiàng)目。

90年代是語(yǔ)音識(shí)別基本成熟的時(shí)期，主流的高斯混合模型GMM-HMM框架逐漸趨于穩(wěn)定，但識(shí)別效果與真正實(shí)用還有一定距離，語(yǔ)音識(shí)別研究的進(jìn)展也逐漸趨緩。由于80年代末90年代初神經(jīng)網(wǎng)絡(luò)技術(shù)的熱潮，神經(jīng)網(wǎng)絡(luò)技術(shù)也被用于語(yǔ)音識(shí)別，提出了多層感知器-隱馬爾科夫模型（MLP-HMM）混合模型。但是性能上無(wú)法超越GMM-HMM框架。

突破的產(chǎn)生始于深度學(xué)習(xí)的出現(xiàn)。隨著深度神經(jīng)網(wǎng)絡(luò)（DNN）被應(yīng)用到語(yǔ)音的聲學(xué)建模中，人們陸續(xù)在音素識(shí)別任務(wù)和大詞匯量連續(xù)語(yǔ)音識(shí)別任務(wù)上取得突破。基于GMM-HMM的語(yǔ)音識(shí)別框架被基于DNN-HMM的語(yǔ)音識(shí)別系統(tǒng)所替代，而隨著系統(tǒng)的持續(xù)改進(jìn)，又出現(xiàn)了深層卷積神經(jīng)網(wǎng)絡(luò)和引入長(zhǎng)短時(shí)記憶模塊（LSTM）的循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN），識(shí)別效果得到了進(jìn)一步提升，在許多（尤其是近場(chǎng)）語(yǔ)音識(shí)別任務(wù)上達(dá)到了可以進(jìn)入人們?nèi)粘Ｉ畹臉?biāo)準(zhǔn)。于是我們看到以Apple Siri為首的智能語(yǔ)音助手、以Echo為首的智能硬件入口等等。而這些應(yīng)用的普及，又進(jìn)一步擴(kuò)充了語(yǔ)料資源的收集渠道，為語(yǔ)言和聲學(xué)模型的訓(xùn)練儲(chǔ)備了豐富的燃料，使得構(gòu)建大規(guī)模通用語(yǔ)言模型和聲學(xué)模型成為可能（見(jiàn)圖1-30）。

圖1-30 語(yǔ)音技術(shù)發(fā)展歷程

自然語(yǔ)言處理

人類的日常社會(huì)活動(dòng)中，語(yǔ)言交流是不同個(gè)體間信息交換和溝通的重要途徑。因此，對(duì)機(jī)器而言，能否自然地與人類進(jìn)行交流、理解人們表達(dá)的意思并做出合適的回應(yīng)，被認(rèn)為是衡量其智能程度的一個(gè)重要參照，自然語(yǔ)言處理也因此成為了繞不開(kāi)的議題。

早在20世紀(jì)50年代，隨著電子計(jì)算機(jī)的出現(xiàn)，產(chǎn)生了許多自然語(yǔ)言處理的任務(wù)需求，其中最典型的就是機(jī)器翻譯。當(dāng)時(shí)存在兩派不同的自然語(yǔ)言處理方法：基于規(guī)則方法的符號(hào)派和基于概率方法的隨機(jī)派。受限于當(dāng)時(shí)的數(shù)據(jù)和算力，隨機(jī)派無(wú)法發(fā)揮出全部的功力，使得符號(hào)派的研究略占上風(fēng)。體現(xiàn)到翻譯上，人們認(rèn)為機(jī)器翻譯的過(guò)程是在解讀密碼，試圖通過(guò)查詢?cè)~典來(lái)實(shí)現(xiàn)逐詞翻譯，這種方式產(chǎn)出的翻譯效果不佳、難以實(shí)用。當(dāng)時(shí)的一些成果包括1959年賓夕法尼亞大學(xué)研制成功的TDAP系統(tǒng)（Transformation and Discourse Analysis Project，最早的、完整的英語(yǔ)自動(dòng)剖析系統(tǒng)）、布朗美國(guó)英語(yǔ)語(yǔ)料庫(kù)的建立等。IBM-701計(jì)算機(jī)進(jìn)行了世界上第一次機(jī)器翻譯試驗(yàn)，將幾個(gè)簡(jiǎn)單的俄語(yǔ)句子翻譯成了英文。在這之后，蘇聯(lián)、英國(guó)、日本等國(guó)家也陸續(xù)進(jìn)行了機(jī)器翻譯試驗(yàn)。

1966年，美國(guó)科學(xué)院的語(yǔ)言自動(dòng)處理咨詢委員會(huì)（ALPAC）發(fā)布了一篇題為《語(yǔ)言與機(jī)器》的研究報(bào)告，報(bào)告全面否定了機(jī)器翻譯的可行性，認(rèn)為機(jī)器翻譯不足以克服現(xiàn)有困難，難以投入使用。這篇報(bào)告澆滅了之前的機(jī)器翻譯熱潮，許多國(guó)家開(kāi)始削減這方面的經(jīng)費(fèi)投入，許多相關(guān)研究被迫暫停，自然語(yǔ)言研究陷入低谷。許多研究者痛定思痛，意識(shí)到兩種語(yǔ)言間的差異不僅體現(xiàn)在詞匯上，還體現(xiàn)在句法結(jié)構(gòu)的差異上，為了提升譯文的可讀性，應(yīng)該加強(qiáng)語(yǔ)言模型和語(yǔ)義分析的研究。里程碑事件出現(xiàn)在1976年，加拿大蒙特利爾大學(xué)與加拿大聯(lián)邦政府翻譯局聯(lián)合開(kāi)發(fā)了名為TAUM-METEO的機(jī)器翻譯系統(tǒng)，提供天氣預(yù)報(bào)服務(wù)。這個(gè)系統(tǒng)每小時(shí)可以翻譯6萬(wàn)～30萬(wàn)個(gè)詞，每天可翻譯1000～2000篇?dú)庀筚Y料，并能夠通過(guò)電視、報(bào)紙立即公布。在這之后，歐盟、日本也紛紛開(kāi)始研究多語(yǔ)言機(jī)器翻譯系統(tǒng)，但并未取得預(yù)期的成效。

到了90年代，自然語(yǔ)言處理進(jìn)入了發(fā)展繁榮期。隨著計(jì)算機(jī)的計(jì)算速度和存儲(chǔ)量大幅增加、大規(guī)模真實(shí)文本的積累產(chǎn)生，以及被互聯(lián)網(wǎng)發(fā)展激發(fā)出的、以網(wǎng)頁(yè)搜索為代表的基于自然語(yǔ)言的信息檢索和抽取需求出現(xiàn)，人們對(duì)自然語(yǔ)言處理的熱情空前高漲。在傳統(tǒng)的基于規(guī)則的處理技術(shù)中，人們引入了更多數(shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)方法，將自然語(yǔ)言處理的研究推向了一個(gè)新高度。除了機(jī)器翻譯之外，網(wǎng)頁(yè)搜索、語(yǔ)音交互、對(duì)話機(jī)器人等領(lǐng)域都有自然語(yǔ)言處理的功勞。

進(jìn)入2010年以后，基于大數(shù)據(jù)和淺層、深層學(xué)習(xí)技術(shù)，自然語(yǔ)言處理的效果得到了進(jìn)一步優(yōu)化。機(jī)器翻譯的效果進(jìn)一步提升，出現(xiàn)了專門的智能翻譯產(chǎn)品。對(duì)話交互能力被應(yīng)用在客服機(jī)器人、智能助手等產(chǎn)品中。這一時(shí)期的一個(gè)重要里程碑事件是IBM研發(fā)的Watson系統(tǒng)參加綜藝問(wèn)答節(jié)目Jeopardy。比賽中Watson沒(méi)有聯(lián)網(wǎng)，但依靠4TB磁盤內(nèi)200萬(wàn)頁(yè)結(jié)構(gòu)化和非結(jié)構(gòu)化的信息，成功戰(zhàn)勝了人類選手取得冠軍，向世界展現(xiàn)了自然語(yǔ)言處理技術(shù)的實(shí)力（見(jiàn)圖1-31）。機(jī)器翻譯方面，谷歌推出的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯（GNMT）相比傳統(tǒng)的基于詞組的機(jī)器翻譯（PBMT），英語(yǔ)到西班牙語(yǔ)的錯(cuò)誤率下降了87%，英文到中文的錯(cuò)誤率下降了58%，取得了非常強(qiáng)勁的提升（見(jiàn)圖1-32）。

圖1-31 IBM Watson在綜藝問(wèn)答節(jié)目Jeopardy中獲勝

圖1-32 自然語(yǔ)言處理發(fā)展歷程

規(guī)劃決策系統(tǒng)

人工智能規(guī)劃決策系統(tǒng)的發(fā)展，一度是以棋類游戲?yàn)檩d體的。最早在18世紀(jì)的時(shí)候，就出現(xiàn)過(guò)一臺(tái)能下棋的機(jī)器，擊敗了當(dāng)時(shí)幾乎所有的人類棋手，包括拿破侖和富蘭克林等。不過(guò)最終被發(fā)現(xiàn)機(jī)器里藏著一個(gè)人類高手，通過(guò)復(fù)雜的機(jī)器結(jié)構(gòu)以混淆觀眾的視線，只是一場(chǎng)騙局而已。真正基于人工智能的規(guī)劃決策系統(tǒng)出現(xiàn)在電子計(jì)算機(jī)誕生之后，1962年時(shí)，Arthur Samuel制作的西洋跳棋程序Checkers經(jīng)過(guò)屢次改進(jìn)后，終于戰(zhàn)勝了州冠軍。當(dāng)時(shí)的程序雖然還算不上智能，但已經(jīng)具備了初步的自我學(xué)習(xí)能力，這場(chǎng)勝利在當(dāng)時(shí)引起了巨大的轟動(dòng)，畢竟是機(jī)器首次在智力的角逐中戰(zhàn)勝人類。這也讓人們發(fā)出了樂(lè)觀的預(yù)言：“機(jī)器將在十年內(nèi)戰(zhàn)勝人類象棋冠軍”。

但人工智能所面臨的困難比人們想象得要大很多，跳棋程序在此之后也敗給了國(guó)家冠軍，未能更上一層樓。而與跳棋相比，國(guó)際象棋要復(fù)雜得多，在當(dāng)時(shí)的計(jì)算能力下，機(jī)器若想通過(guò)暴力計(jì)算戰(zhàn)勝人類象棋棋手，每步棋的平均計(jì)算時(shí)長(zhǎng)是以年為單位的。人們也意識(shí)到，只有盡可能減少計(jì)算復(fù)雜度，才可能與人類一決高下。于是，“剪枝法”被應(yīng)用到了估值函數(shù)中，通過(guò)剔除掉低可能性的走法，優(yōu)化最終的估值函數(shù)計(jì)算。在“剪枝法”的作用下，西北大學(xué)開(kāi)發(fā)的象棋程序Chess4.5在1976年首次擊敗了頂尖人類棋手。進(jìn)入80年代，隨著算法上的不斷優(yōu)化，機(jī)器象棋程序在關(guān)鍵勝負(fù)手上的判斷能力和計(jì)算速度上大幅提升，已經(jīng)能夠擊敗幾乎所有的頂尖人類棋手。

到了90年代，硬件性能、算法能力等都得到了大幅提升，在1997年那場(chǎng)著名的人機(jī)大戰(zhàn)中，IBM研發(fā)的深藍(lán)（Deep Blue）戰(zhàn)勝國(guó)際象棋大師卡斯帕羅夫，人們意識(shí)到在象棋游戲中人類已經(jīng)很難戰(zhàn)勝機(jī)器了（見(jiàn)圖1-33）。

圖1-33 IBM深藍(lán)戰(zhàn)勝國(guó)際象棋大師卡斯帕羅夫

到了2016年，硬件層面出現(xiàn)了基于GPU、TPU的并行計(jì)算，算法層面出現(xiàn)了蒙特卡洛決策樹(shù)與深度神經(jīng)網(wǎng)絡(luò)的結(jié)合。4∶1戰(zhàn)勝李世石；在野狐圍棋對(duì)戰(zhàn)頂尖棋手60連勝；3∶0戰(zhàn)勝世界排名第一的圍棋選手柯潔，隨著棋類游戲最后的堡壘——圍棋也被AlphaGo所攻克，人類在完美信息博弈的游戲中已徹底輸給機(jī)器，只能在不完美信息的德州撲克和麻將中茍延殘喘。人們從棋類游戲中積累的知識(shí)和經(jīng)驗(yàn)，也被應(yīng)用在更廣泛的需要決策規(guī)劃的領(lǐng)域，包括機(jī)器人控制、無(wú)人車等等。棋類游戲完成了它的歷史使命，帶領(lǐng)人工智能到達(dá)了一個(gè)新的歷史起點(diǎn)（見(jiàn)圖1-34）。

圖1-34 規(guī)劃決策系統(tǒng)發(fā)展歷程

人工智能的第三次浪潮

自1956年夏天在達(dá)特茅斯夏季人工智能研究會(huì)議上人工智能的概念被第一次提出以來(lái)，人工智能技術(shù)的發(fā)展已經(jīng)走過(guò)了60年的歷程。在這60年里，人工智能技術(shù)的發(fā)展并非一帆風(fēng)順，其間經(jīng)歷了20世紀(jì)50—60年代以及80年代的人工智能浪潮期，也經(jīng)歷過(guò)70—80年代的沉寂期。隨著近年來(lái)數(shù)據(jù)爆發(fā)式的增長(zhǎng)、計(jì)算能力的大幅提升以及深度學(xué)習(xí)算法的發(fā)展和成熟，我們已經(jīng)迎來(lái)了人工智能概念出現(xiàn)以來(lái)的第三個(gè)浪潮期。然而，這一次的人工智能浪潮與前兩次的浪潮有著明顯的不同。基于大數(shù)據(jù)和強(qiáng)大計(jì)算能力的機(jī)器學(xué)習(xí)算法已經(jīng)在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理等一系列領(lǐng)域中取得了突破性的進(jìn)展，基于人工智能技術(shù)的應(yīng)用也已經(jīng)開(kāi)始成熟。同時(shí)，這一輪人工智能發(fā)展的影響已經(jīng)遠(yuǎn)遠(yuǎn)超出學(xué)界之外，政府、企業(yè)、非營(yíng)利機(jī)構(gòu)都開(kāi)始擁抱人工智能技術(shù)。AlphaGo對(duì)李世石的勝利更使得公眾開(kāi)始認(rèn)識(shí)、了解人工智能。我們身處的第三次人工智能浪潮僅僅是一個(gè)開(kāi)始。在人工智能概念被提出一個(gè)甲子后的今天，人工智能的高速發(fā)展為我們揭開(kāi)了一個(gè)新時(shí)代的帷幕。

官术网_书友最值得收藏!

人工智能

第二章 人工智能的過(guò)去

人工智能的概念

人工智能的層次

人工智能的第三次浪潮

第二章
人工智能的過(guò)去