- 人工智能+機器人入門與實戰
- 陳宇航 侯俊萍 葉昶
- 9字
- 2020-05-08 17:01:40
第1章 走近人工智能
1.1 初識人工智能
1.1.1 人工智能是什么
人工智能(Artificial Intelligence,AI),也被稱作機器智能,指由人制造的機器所表現出來的智能。通常人工智能是指通過計算機程序實現的智能技術,因此常常被視作計算機科學的一個分支。
人工智能的研究具有高度的技術性和專業性,各分支領域都是深入且各不相通的,因而涉及范圍極廣。人工智能的核心問題包括構建能夠跟人類相似甚至超越人的推理、知識、規劃、學習、交流、感知、移動和操作物體的能力等。
雖然人工神經網絡下的深度學習算法在20世紀80年代已有了突破性進展,但由于計算機計算能力的限制,其在人工智能領域的應用還沒有發揮出應有的威力。近年來,隨著超級計算機算力的飛速提升,加之深度學習算法的進一步優化,人工智能在視頻識別、語言分析、棋類游戲等單方面的能力已經達到了超越人類的水平。另一方面,一個人工智能程序能夠同時解決這幾方面的不同問題,充分體現了人工智能的通用性。
人工智能的一個比較流行的定義,也是該領域較早的定義,是由當時麻省理工學院的約翰·麥卡錫在1956年的達特茅斯會議上提出的:人工智能就是要讓機器的行為看起來就像是人所表現出的智能行為一樣。隨著人工智能60余年的發展,這個定義方式也在受到沖擊。總的來說,人工智能的本質就是對人的思維的信息過程的模擬。
1.1.2 人工智能的發展歷程
人工智能的起源
早在20世紀四五十年代,數學系與計算機工程師就已經開始探討用機器模擬智能的可能。
1950年,艾倫·圖靈(見圖1.1)提出了著名的圖靈測試:人類測試員通過文字與密室里的一臺機器和一個人自由對話,如果測試員無法分辨誰是人、誰是機器,則參與對話的機器就被認為通過測試。

圖1.1 艾倫·圖靈(Alan Turing)(1912—1954年)
圖靈測試在過去數十年中一直被廣泛認為是測試機器智能的重要標準,對人工智能的發展產生了極為深遠的影響。
1956年,約翰·麥卡錫等10人在美國達特茅斯學院開會研討“如何用機器模擬人的智能”,會上提出“人工智能”這一概念,這標志著人工智能學科的誕生。
人工智能研究發展的起起落落
人工智能概念的提出給世界帶來了很大的震撼,人們樂觀地預測,人類將在短時間內制造出完全智能的機器。麻省理工學院的約瑟夫·維森鮑姆(Joseph Weizenbaum)在1966年發表了世界第一款自然語言對話程序Eliza(見圖1.2)。這款程序可以模擬人與人聊天的過程。雖然Eliza只是基于人類的對話提取關鍵詞并做出預設的反應,但在早年還是讓許多用戶誤認為是在與真實人類對話。

圖1.2 Eliza與人的對話
然而,雖然如Eliza這樣的早期人工智能產品層出不窮,但還是難以滿足社會上對于人工智能的過高期待。從20世紀70年代起,對人工智能的批評聲越來越多,公眾的熱情與投資都出現了大幅度的消退。
直到20世紀80年代,隨著卡耐基·梅隆大學為DEC公司開發的專家系統XCON在商業上的巨大成功,人工智能才重新回到業界的視線中。專家系統是一種基于特定規則回答特定領域問題的系統,例如,XCON可以幫助DEC公司根據客戶的需求自動選擇計算機部件組合,準確率達到了專業技師的水平從而節省了大量的人力成本。但到了這一時期,人們已經逐漸不再追求建立一個通用的模擬人類的人工智能,而是開始專注于通過人工智能來解決具體領域的實際問題。
另一方面,在這一時期,人工神經網絡(Artificial Neural Network,ANN)的研究也取得了重要進展。人工神經網絡是一種模仿動物大腦的結構和功能的數學模型。人工神經網絡通常由大量的人工神經元聯結進行計算,并可以在外界信息的基礎上改變內部結構,也就是具備學習功能。在20世紀80年代,反向傳播算法有了關鍵進展,其被證明是用于人工神經網絡訓練的有效方法。
但到了20世紀80年代末、90年代初,業界逐漸發現以專家系統為代表的人工智能系統往往開發和維護成本高昂,而商業價值有限,人工智能的發展再次步入寒冬。
人工智能的新浪潮
進入21世紀后,計算機芯片的運算能力得到了飛速的提升。在這一背景下,人工智能算法也取得了重大發展。基于強勁的運算力,人工神經網絡在語音識別、圖像分析、視頻理解等諸多領域都創造了新的成功。
2016年,谷歌(Google)旗下DeepMind開發的人工智能圍棋程序AlphaGo通過人工神經網絡深度學習訓練,在一場舉世矚目的人機大戰中以4:1戰勝了圍棋世界冠軍李世石九段。這次成功點燃了社會對于新時代人工智能的巨大熱情,人們開始意識到人工智能在很多領域的能力已經遠超人類。
DeepMind團隊在2017年末推出了增強版的人工智能下棋程序AlphaZero。它與初版的AlphaGo相比有幾點重大的改變:一是AlphaZero只需要棋類的基本規則作為訓練的基礎,不需要任何人類棋譜作為參考;二是它采用了更為通用的算法,可以延展到將棋與國際象棋中。在短時間(34小時內)訓練后,AlphaZero成功擊敗了圍棋、將棋、國際象棋領域的當時最強的AI程序。這一成果讓人們更清晰地認識到了機器自我學習的潛力,并對人工智能具備更強的通用性充滿期待。
1.1.3 人工智能的應用現狀
人工智能的概念覆蓋了機器視覺、語音識別與人機交互、自動駕駛等多個范疇,在當今社會中已有著大量的運用。
機器視覺
機器視覺是指在人工智能系統中配備有視覺儀器并通過視覺儀器捕捉到的情報進行分析處理。機器視覺目前被廣泛應用于安防、車牌識別系統、醫療輔助診斷、工業化生產線中。
在安防領域,機器視覺可以從大量監控視頻數據中提取出有效的信息,從而輔助警方偵破案件;在醫療輔助診斷方面,機器視覺可以對醫學影像進行分析,從而減少誤診或漏診;在工業化生產中,機器視覺則可以對物品進行分類與分揀。
語音識別與人機交互
正確識別并理解人類語言一直以來都是人工智能研究的重要課題。近年來,這一領域也得到了高速發展。現在的人工智能系統能夠以相當高的準確率將人類說的話轉化為文本,并基于對語義的理解判斷用意,進而做出針對性的答復。這一流程包含語音文字轉化、自然語言理解等多個環節。
目前,主流網絡視頻流媒體服務提供商都提供了高效的人工智能自動實時字幕功能;Siri等移動智能助手也正一步步地進入我們的生活;而基于人工智能打造的智能客服系統還能有效地替代部分傳統人工客服的作用并同時針對客戶需求進行數據分析與優化。
自動駕駛
自動駕駛技術目前發展速度極為迅猛,大量的傳統車企和科技公司紛紛投身于這一巨大的市場。Google旗下的自動駕駛汽車已經在小范圍投入商業使用,而特斯拉汽車已經通過OTA(Over the Air)升級具備了部分自動駕駛功能。按照目前的發展趨勢,自動駕駛汽車大范圍投入實際使用已近在咫尺。
自動駕駛汽車顯然是一個基于人工智能的復雜系統,它需要借助車載的大量傳感器實時監測數據并進行分析,選擇合適的行駛路線,保證高效、安全地運行。