- 智能與數據重構世界
- (美)薄智泉 徐亭主編
- 2359字
- 2020-09-25 12:47:17
2.5 智能化人機交互
人機交互主要研究人和計算機之間的信息交換,主要包括人到計算機和計算機到人兩部分的信息交換,是人工智能領域的重要外圍技術。人機交互是與認知心理學、人機工程學、多媒體技術、虛擬現實技術等密切相關的綜合學科。傳統的人與計算機之間的信息交換主要依靠交互設備進行,交互設備包括鍵盤、鼠標、操縱桿、眼動跟蹤器、位置跟蹤器、數據手套、壓力筆等輸入設備,以及打印機、繪圖儀、顯示器、音箱等輸出設備。
如圖2-25所示,除了傳統的基本交互和圖形交互,隨著人工智能技術的迅猛發展,原來處于科幻小說中的交互方式逐漸走向現實,走進我們的日常生活。隨著消費產品和生活場景的升級變化,人機交互方式也必然會隨之更新。

圖2-25 人機交互分類
2.5.1 語音交互
語音交互是一種高效的交互方式,是人以自然語音或機器合成語音同計算機進行交互的綜合性技術,結合了語言學、心理學、工程和計算機技術等領域的知識。研究語音交互不僅要對語音識別和語音合成進行研究,還要對人在語音通道下的交互機理、行為方式等進行研究。語音交互過程包括四部分:語音采集、語音識別、語義理解和語音合成。語音采集完成音頻的錄入、采樣及編碼;語音識別完成語音信息到機器可識別的文本信息的轉化;語義理解根據語音識別轉換后的文本字符或命令完成相應的操作;語音合成完成文本信息到聲音信息的轉換。語音交互比其他交互方式具備更多優勢,能為人機交互帶來根本性變革,是大數據和認知計算時代未來發展的制高點,具有廣闊的發展前景和應用前景。另外,在特定的應用場景下,如無人駕駛、智能家居等,語音交互是最便捷的交互方式。
最早的、成熟應用的語音交互系統——客服中的語音應答系統出現在20世紀90年代,并且目前還在廣泛使用,它可以通過電話線路理解人們的話并執行相應的任務。而真正與AI結合的、走進人們生活的語音交互系統,是各大IT公司推出的語音助手,代表產品有蘋果的Siri、微軟的Cortana、Amazon的Alexa。而最近幾年,結合語音助手的智能音箱,如Amazon的Echo和Google的Google Home之類的設備,更是給我們提供了對未來生活和工作場景的想象空間。
和語音交互最相關的人工智能技術是自然語言處理(NLP)。近幾年,Siri等的體驗不斷改善,這與自然語言處理的一個個技術難題的突破密切相關。
2.5.2 情感交互
情感是一種高層次的信息傳遞,而情感交互是一種交互狀態,它在表達功能和信息時傳遞情感,勾起人們的記憶或內心的情愫。傳統人機交互中的計算機無法理解和適應人的情緒或心境,缺乏情感理解和表達能力,難以具有類似人一樣的智能。情感交互就是要賦予計算機類似于人一樣的觀察、理解和生成各種情感的能力,最終使計算機像人一樣進行自然、親切和生動地交互。情感交互已經成為人工智能領域中的熱點方向。目前,其在情感交互信息的處理方式、情感描述方式、情感數據獲取和處理過程、情感表達方式等方面還有諸多技術挑戰。
在毛峽所著的《人機情感交互》一書中,作者將情感交互分成七大階段:人臉表情交互;語音信號情感交互;肢體行為情感交互;生理信號情感識別;文本信息中的情感;情感仿生代理;多模情感人機交互。emojis就是人臉表情交互的一個例子。
2.5.3 體感交互
體感交互指個體不需要借助任何復雜的控制系統,以體感技術為基礎,直接通過肢體動作與周邊數字設備和環境進行自然的交互。依照體感方式與原理的不同,體感交互技術主要分為三類:慣性感測、光學感測及光學聯合感測。體感交互通常由運動追蹤、手勢識別、運動捕捉、面部表情識別等一系列技術支撐。與其他交互手段相比,體感交互無論是在硬件還是在軟件方面都有了較大的提升,交互設備向小型化、便攜化、使用方便化等方面發展,大大減少了對用戶的約束,使得交互過程更加自然。目前,體感交互在游戲娛樂、醫療輔助與康復、全自動三維建模、輔助購物、眼動儀等領域有較為廣泛的應用。
體感交互被稱為第三次交互革命,是21世紀最激動人心的技術成果之一。它使人工智能的視覺感知成為現實,使機器擁有類似人類的三維立體視覺,并可區別不同的物體,辨識不同的人體行為動作,可像人眼一樣實時地在千變萬化的環境中看到每個人的行為動作及理解動作的含義。體感設備對人群行為進行自動識別、判斷、報警和跟蹤,將根本性地促進智能安防、智能家居、機器人等領域產業的快速發展,從而讓智能看護走進醫院、養老院、兒童娛樂中心和千家萬戶;讓人們可以在家向奧運冠軍學習體育,向郎朗學習鋼琴;讓機器人也能所看即所知,實現自動控制和自我反饋。
2.5.4 腦機交互
腦機交互又稱腦機接口,指不依賴于外圍神經和肌肉等神經通道,直接實現大腦與外界信息傳遞的通路[14]。腦機接口系統檢測中樞神經系統活動,并將其轉化為人工輸出指令,能夠替代、修復、增強、補充或改善中樞神經系統的正常輸出,改變中樞神經系統與內外環境之間的交互作用,從而幫助在溝通或行動方面有障礙的人群。腦機交互通過對神經信號解碼實現腦電波信號到機器指令的轉化,一般包括信號采集、特征提取和命令輸出三個模塊。從腦電波信號采集的角度,一般將腦機交互分為侵入式和非侵入式兩大類。前者指利用無線信號接收器來獲得腦電波信號,而后者指在一個神經元旁邊埋上一根細線來記錄電化學活動并將其發送給計算機。只要從大腦中的特定區域記錄足夠多的電化學信號,人們就可以僅憑思考或簡單的移動來控制計算機或任何其他想控制的東西。
腦機交互作為傳統意義上的黑科技,可以說是最激動人心的一項技術了,同時,其也廣泛出現在各科幻場景中。但是,受限于我們對腦認知科學的認識,真正要實現人機一體的無縫交互,還有很長的一段路要走。在某些領域,腦機交互已經有了一些研究成果,侵入式腦機交互在幾年前已經可以(以可接受的精確度)控制機械手的三維運動、手腕方向、手指握力。腦機交互是未來,被認為是計算機與腦科學發展的完美結合,但目前時機尚未成熟,還需要無數科學家在這一領域進行長期不懈的探索。
- 程序員修煉之道:從小工到專家
- Python絕技:運用Python成為頂級數據工程師
- 計算機信息技術基礎實驗與習題
- SQL Server 2008數據庫應用技術(第二版)
- 數據化網站運營深度剖析
- Neural Network Programming with TensorFlow
- 數據庫應用基礎教程(Visual FoxPro 9.0)
- 數據驅動設計:A/B測試提升用戶體驗
- Oracle 12c云數據庫備份與恢復技術
- Power BI商業數據分析完全自學教程
- 云數據中心網絡與SDN:技術架構與實現
- Hadoop大數據開發案例教程與項目實戰(在線實驗+在線自測)
- 探索新型智庫發展之路:藍迪國際智庫報告·2015(上冊)
- Hadoop 3實戰指南
- 機器學習:實用案例解析