- Python自然語言理解:自然語言理解系統開發與應用實戰
- (美)黛博拉·A. 達爾
- 339字
- 2024-09-10 16:34:46
1.5.7 信息抽取
信息抽取是另一種NLP的應用類型。信息抽取從諸如報紙文章之類的文本中提取結構化信息,這種信息可以用來填充數據庫。例如,可以從新聞報道的文本中抽取一個事件的日期、具體時間、參與者和地點等重要信息。這些信息與之前討論聊天機器人和語音助手時所提到的意圖和實體非常相似,我們會發現這兩種類型的應用程序使用許多相同的處理方法。
在信息抽取應用程序中,還有一個任務是命名實體識別(Named Entity Recognition,NER),用于識別人物、組織和位置在文本中的指代。在報紙文章等長文本中,通常用多種方法來指代同一個人。例如,“喬·拜登”可能被稱為“總統”“拜登先生”“他”,甚至“前副總統”等。在識別對“喬·拜登”的指代詞時,信息抽取應用程序還必須避免將“拜登博士”誤解為“喬·拜登”,因為“拜登博士”指的是他的妻子。
推薦閱讀
- DevOps:軟件架構師行動指南
- Getting Started with Gulp(Second Edition)
- PaaS程序設計
- Oracle Database 12c Security Cookbook
- JSP開發案例教程
- FFmpeg入門詳解:音視頻原理及應用
- C++ 從入門到項目實踐(超值版)
- Getting Started with NativeScript
- Visual C++程序設計與項目實踐
- C#程序設計基礎入門教程
- Clojure Web Development Essentials
- 游戲設計的底層邏輯
- Design Patterns and Best Practices in Java
- Learning Redux
- C#網絡編程高級篇之網頁游戲輔助程序設計