官术网_书友最值得收藏!

1.5.5 文檔檢索

文檔檢索的任務是根據用戶的搜索文本提供滿足用戶搜索查詢的文檔。這方面最好的例子是我們每天都要進行多次的網絡搜索。網絡搜索是最為人熟知的文檔檢索示例,但文檔檢索方法也適用于在任意一組文檔中查找信息,例如,文檔可以是數據庫或表單的文本字段。

文檔檢索基于用戶查詢文本和已有文檔之間的良好匹配,因此需要同時分析用戶的查詢文本和文檔。可以使用關鍵詞搜索完成文檔檢索任務,但簡單的關鍵詞搜索容易出現兩種錯誤。首先,查詢中的關鍵詞可能與文檔中匹配的關鍵詞有著不同的含義。例如,如果一個用戶在尋找glasses,他需要的是戴在眼睛上的眼鏡,而不是喝酒用的杯子(注意,眼鏡和杯子在英文中都是glasses)。另一種錯誤是由于關鍵詞不匹配而找不到相關結果。如果用戶只使用了關鍵詞glasses,就可能發生這種情況,即錯過使用關鍵詞spectacles或eyewear找到的結果,即使用戶對這些結果感興趣。使用NLP方法代替簡單的關鍵詞查找技術可以提供更準確的結果。

主站蜘蛛池模板: 晋江市| 榕江县| 长汀县| 临海市| 高雄市| 靖西县| 车致| 卢氏县| 罗平县| 循化| 邹城市| 汽车| 孝义市| 河源市| 巧家县| 仁布县| 乌什县| 区。| 大关县| 榕江县| 腾冲县| 吴川市| 禹州市| 根河市| 乐亭县| 德江县| 新田县| 合水县| 会东县| 新乡市| 哈尔滨市| 临安市| 柏乡县| 来宾市| 博客| 孟连| 南丹县| 林口县| 江口县| 承德市| 荣成市|