官术网_书友最值得收藏!

1.4 交互式應用程序——聊天機器人與語音助手

NLP應用可以被大致分為兩類:一類為交互式應用程序,其重點關注的是人機對話;另一類為非交互式應用程序,其重點關注的是一個文檔或一組文檔。

在交互式應用程序中,用戶與系統能夠實時交談或互發信息。常見的交互式應用程序包括聊天機器人和語音助手,如智能音箱和客戶服務應用程序等。這些應用程序的交互性要求系統要做出快速、幾乎即時的響應,因為用戶正在等待系統的響應。根據交談習慣,用戶通常不會容忍延遲超過幾秒鐘的回復。這些應用的另一個特點是用戶輸入通常很短,在口語交互情景下,用戶的語音輸入可能只有幾個詞或只持續幾秒鐘。這意味著依賴于大量可用文本的分析方法將無法很好地適用于這些應用程序。

除了NLU本身之外,實現一個交互式應用程序很可能還需要圖1.2中的一個或多個其他模塊。顯然,具有語音輸入的應用程序將需要語音識別模塊,而對用戶以語音或文本做出響應的應用程序則需要自然語言生成模塊和文本到語音轉換模塊(如果系統的響應是語音)。任何需要完成多輪對話的應用程序還需要某種形式的對話管理,用于跟蹤用戶之前在對話中說了什么,并在后續組織系統響應時將這些信息考慮在內。

意圖識別是交互式自然語言應用程序的一個重要方面,這將在第9章和第14章中進行詳細討論。意圖本質上是用戶在發表言論時的目標或目的。顯然,了解用戶的意圖是為用戶提供正確信息的核心。除了意圖之外,交互式應用程序通常還需要識別用戶輸入中的實體詞實體,其中實體是系統為了解決用戶意圖而需要的附加信息。例如,如果一個用戶說:我想預訂一張從波士頓到費城的機票。”意圖將是“預訂機票”,相關的實體是出發地和目的地。由于預訂航班還需要旅行日期,因此日期也是實體。因為用戶在這句話中沒有提到旅行日期,所以系統接下來應該詢問用戶日期問題,這個過程叫作槽填充(slot filling),將在第8章中進行討論。實體、意圖和用戶所提問題之間的關系如圖1.3所示。

圖1.3 用戶所提旅行問題中的意圖和實體

請注意,意圖代表一句話的整體含義,但實體只代表這句話中特定部分的含義。這個區別很重要,因為這涉及選擇什么樣的機器學習模型來處理這些信息。第9章將更詳細地討論這個話題。

主站蜘蛛池模板: 兰坪| 沁阳市| 板桥市| 哈巴河县| 九台市| 巩义市| 娄底市| 泸西县| 沙田区| 平度市| 伊川县| 南平市| 民权县| 无棣县| 济阳县| 盘山县| 汤阴县| 无为县| 桓仁| 和政县| 城市| 武威市| 镇坪县| 南昌县| 阿瓦提县| 綦江县| 河间市| 丽江市| 万年县| 闸北区| 扬州市| 隆化县| 荔浦县| 苏尼特左旗| 吉木萨尔县| 开远市| 北川| 芜湖县| 昌乐县| 庆阳市| 曲麻莱县|