- Python自然語(yǔ)言理解:自然語(yǔ)言理解系統(tǒng)開(kāi)發(fā)與應(yīng)用實(shí)戰(zhàn)
- (美)黛博拉·A. 達(dá)爾
- 1963字
- 2024-09-10 16:34:48
2.1 識(shí)別適合當(dāng)前技術(shù)水平的問(wèn)題
請(qǐng)注意
本章主要關(guān)注技術(shù)和方法。其他因素(如市場(chǎng)可行性或客戶吸引力等問(wèn)題)同樣重要,但不在本書的討論范圍之內(nèi)。
當(dāng)今的NLU方法擅長(zhǎng)處理單一固定任務(wù),以下是一些非常適合當(dāng)前NLU技術(shù)水平的項(xiàng)目示例:
?將產(chǎn)品評(píng)論分類為正面評(píng)論和負(fù)面評(píng)論:在線商家通常為消費(fèi)者提供評(píng)論所購(gòu)買產(chǎn)品的機(jī)會(huì),這對(duì)其他潛在的消費(fèi)者和商家都有幫助。但大型在線零售商面臨著如何處理成千上萬(wàn)條評(píng)論的挑戰(zhàn)。人工審查每條評(píng)論幾乎不可能,因此需要一個(gè)自動(dòng)化的商品評(píng)論分類系統(tǒng)。
?自動(dòng)回答諸如賬戶余額或最近交易信息等銀行基本業(yè)務(wù)問(wèn)題:銀行等金融機(jī)構(gòu)都設(shè)有客服電話中心,專門處理客戶問(wèn)題。通常,客戶電話詢問(wèn)的問(wèn)題都相對(duì)簡(jiǎn)單,如查詢賬戶余額等。銀行可以根據(jù)客戶的賬號(hào)信息查詢銀行數(shù)據(jù)庫(kù),從而獲得客戶問(wèn)題的答案。一個(gè)自動(dòng)化系統(tǒng)可以通過(guò)詢問(wèn)來(lái)電者銀行賬號(hào)等所需信息來(lái)處理這些問(wèn)題。
?簡(jiǎn)單的股票交易:股票買賣通常非常復(fù)雜,但在許多情況下,用戶只是想購(gòu)買或出售某個(gè)公司一定數(shù)量的股票。完成這種交易只需要幾個(gè)關(guān)鍵信息,例如股票賬號(hào)、公司名稱、股票數(shù)量以及是購(gòu)買還是出售股票等。
?包裹追蹤:包裹追蹤通常只需包裹賬號(hào),通過(guò)查詢包裹賬號(hào)可以告訴用戶包裹的狀態(tài)。雖然在線包裹追蹤很常見(jiàn),但有時(shí)人們無(wú)法訪問(wèn)互聯(lián)網(wǎng)。使用基于自然語(yǔ)言處理方法的語(yǔ)音應(yīng)用程序,用戶只需打個(gè)電話即可追蹤包裹。
?轉(zhuǎn)接客戶問(wèn)題至正確的客服代表:很多客戶問(wèn)題需要由人工客服回答。對(duì)于這些客戶,電話客服中心的NLU系統(tǒng)可以將客戶轉(zhuǎn)接至適合的部門以獲取人工客服服務(wù)。NLU系統(tǒng)可以詢問(wèn)客戶打電話的原因,分析客戶的請(qǐng)求,然后自動(dòng)地將電話轉(zhuǎn)接至處理該問(wèn)題的專業(yè)客服或部門。
?提供天氣預(yù)報(bào)、體育比賽成績(jī)和歷史事實(shí)等信息:這類應(yīng)用的特點(diǎn)是請(qǐng)求中包含具體明確的參數(shù)。例如,查詢體育比賽成績(jī),參數(shù)可能是一個(gè)球隊(duì)的名字,也可能是一場(chǎng)比賽的日期;查詢天氣預(yù)報(bào),參數(shù)包括位置和時(shí)間。
所有這些應(yīng)用的特點(diǎn)是有明確、正確的答案,并且用戶的輸入語(yǔ)言相對(duì)簡(jiǎn)單。這些都是適合當(dāng)今NLU技術(shù)水平的項(xiàng)目。
下面將詳細(xì)介紹提供天氣預(yù)報(bào)、體育比賽比分和史實(shí)信息的系統(tǒng),以解釋為什么這些應(yīng)用非常適合當(dāng)今的NLU技術(shù)。
圖2.1展示了一個(gè)可以提供各種不同城市天氣預(yù)報(bào)的應(yīng)用程序示例。當(dāng)用戶詢問(wèn)“紐約市明天的天氣如何”時(shí),系統(tǒng)開(kāi)始工作。請(qǐng)注意,用戶提出的是一個(gè)單一的、簡(jiǎn)短的查詢,請(qǐng)求獲取特定信息——特定日期、特定地點(diǎn)的天氣預(yù)報(bào)。NLU系統(tǒng)需要檢測(cè)意圖(天氣預(yù)報(bào))、實(shí)體(地點(diǎn)和日期)。這些都相對(duì)容易獲取,因?yàn)閷?shí)體非常獨(dú)特,而且天氣預(yù)報(bào)這一意圖也不太可能與其他意圖混淆。這使得NLU系統(tǒng)能夠直接將用戶的問(wèn)題轉(zhuǎn)換為適合氣象服務(wù)網(wǎng)站處理的結(jié)構(gòu)化信息,如圖2.1所示。

圖2.1 一個(gè)NLU的實(shí)際應(yīng)用示例
雖然被請(qǐng)求的信息不太復(fù)雜,但還是存在許多詢問(wèn)方式。因此,列出一個(gè)用戶可能問(wèn)的問(wèn)題列表并不切實(shí)際。表2.1展示了一些查詢天氣的問(wèn)題。
這個(gè)查詢天氣的應(yīng)用是一個(gè)典型的NLU應(yīng)用,因?yàn)楹苋菀讖臍庀蠓?wù)網(wǎng)站獲取用戶所詢問(wèn)的信息(天氣預(yù)報(bào)),而且氣象服務(wù)網(wǎng)站還提供了應(yīng)用程序接口(Application Programming Interface,API)。這使得開(kāi)發(fā)人員可以向氣象服務(wù)網(wǎng)絡(luò)發(fā)送查詢信息,并得到以結(jié)構(gòu)化表示的用戶所需信息。然后,開(kāi)發(fā)人員可以選擇如何向用戶呈現(xiàn)這些信息,例如以文本形式、圖片形式或文本與圖片相結(jié)合的形式。
表2.1 查詢天氣的多種問(wèn)題

如圖2.1所示,開(kāi)發(fā)人員選擇使用自然語(yǔ)言來(lái)表示信息。因此,使用自然語(yǔ)言生成(Natural Language Generation,NLG)模塊將結(jié)構(gòu)化信息轉(zhuǎn)換為自然語(yǔ)言作為輸出。其他展示方式可以是圖像展示,例如部分被云層覆蓋的太陽(yáng)的圖片,也可以直接展示氣象服務(wù)網(wǎng)站提供的信息。然而,只有NLG適用于語(yǔ)音應(yīng)用(如智能對(duì)話系統(tǒng)),因?yàn)檎Z(yǔ)音應(yīng)用系統(tǒng)無(wú)法顯示圖像。
在天氣預(yù)報(bào)等應(yīng)用程序中使用NLU的最大好處是,盡管用戶可以以眾多方式提出同一個(gè)問(wèn)題,但NLU可以以相同的意圖處理該問(wèn)題,如表2.1所示。
表2.1展示了查詢天氣的多種說(shuō)法或同義問(wèn)題。這些說(shuō)法只是詢問(wèn)天氣的一些可能方式。即使是一個(gè)簡(jiǎn)單的問(wèn)題,也存在多種不同的提問(wèn)方式。如果我們可以列出一個(gè)問(wèn)題的所有問(wèn)法,那么即使列出的問(wèn)法很多,NLU也沒(méi)有存在的必要了。
理論上,我們可以列出一個(gè)問(wèn)題的所有問(wèn)法,并將它們映射為結(jié)構(gòu)化的查詢信息。但實(shí)際上,即使是一個(gè)簡(jiǎn)單的查詢天氣問(wèn)題,也很難列出人們問(wèn)這個(gè)問(wèn)題的所有說(shuō)法。如果一個(gè)用戶碰巧問(wèn)了一個(gè)不在列表中的問(wèn)題,那么系統(tǒng)將無(wú)法響應(yīng)。這可能會(huì)讓用戶感到困惑,因?yàn)橛脩舨焕斫鉃槭裁串?dāng)問(wèn)類似的問(wèn)題時(shí)系統(tǒng)可以工作,但當(dāng)問(wèn)這個(gè)問(wèn)題時(shí)系統(tǒng)沒(méi)有回應(yīng)。NLU系統(tǒng)應(yīng)該具備處理表述稍有不同但意思相同問(wèn)題的能力。
正如本節(jié)所示,如果一個(gè)應(yīng)用程序具有清晰且易于識(shí)別的意圖和實(shí)體,并且可以從網(wǎng)絡(luò)中獲取明確的答案,那么使用當(dāng)前的NLU方法,這個(gè)應(yīng)用程序成功的機(jī)會(huì)很大。
現(xiàn)在,讓我們轉(zhuǎn)向那些不太可能成功的應(yīng)用程序,因?yàn)檫@些應(yīng)用程序所需要的NLU技術(shù)超越了當(dāng)前技術(shù)水平。
- Learning Python Web Penetration Testing
- The Complete Rust Programming Reference Guide
- Mastering SVG
- 機(jī)械工程師Python編程:入門、實(shí)戰(zhàn)與進(jìn)階
- R的極客理想:工具篇
- Serverless架構(gòu)
- Go并發(fā)編程實(shí)戰(zhàn)
- Java網(wǎng)絡(luò)編程核心技術(shù)詳解(視頻微課版)
- ServiceNow:Building Powerful Workflows
- Unity&VR游戲美術(shù)設(shè)計(jì)實(shí)戰(zhàn)
- Mastering Docker
- Mastering Elixir
- Oracle 12c從入門到精通(視頻教學(xué)超值版)
- Docker:容器與容器云(第2版)
- 關(guān)系數(shù)據(jù)庫(kù)與SQL Server 2012(第3版)