官术网_书友最值得收藏!

第1章 搜索引擎

每天都有很多人通過聊天軟件進行交流。理想的聊天軟件應該能夠自動在服務器中永久記錄聊天記錄,而且有強大的搜索功能。

當用戶只輸入個別詞時,搜索引擎系統可以猜測用戶的查詢意圖,把用戶查詢意圖擴展成整句。

搜索界面可以用WebSocket登錄方式重新實現,這樣可以給出個性化的查詢結果。例如,如果已經知道某個用戶在使用Macbook,當他搜索“eclipse下載”時,則給他提供Mac版本的Eclipse下載地址。

本章首先概要地介紹搜索引擎的總體結構和基本模塊,然后介紹其中最核心的模塊:全文檢索的基本原理。為了盡快普及搜索引擎開發技術,本章介紹的搜索引擎結構可以采用開源軟件實現。為了通過實踐來深入了解相關技術,本章會介紹相關的開發環境。本書所介紹的搜索技術使用Java編程語言實現,之所以沒有采用性能可能會更好的C/C++,是因為Java代碼的可維護性更好。C++開發團隊的協作性更差,往往淪為手工作坊式的開發。另外,為了集中關注程序的基本邏輯,書中的Java代碼去掉了一些錯誤和異常處理,實際可以運行的代碼在本書附贈的資源中。在以后的各章中會深入探索搜索引擎的每個組成模塊。

主站蜘蛛池模板: 双辽市| 榆林市| 宿松县| 淮安市| 上杭县| 台州市| 乳源| 锡林郭勒盟| 互助| 隆子县| 福贡县| 汝城县| 新巴尔虎右旗| 那坡县| 麻城市| 府谷县| 梁河县| 河曲县| 溧阳市| 社旗县| 雷波县| 贵溪市| 绍兴县| 莱阳市| 孟连| 浠水县| 百色市| 新乡市| 永丰县| 虞城县| 宁阳县| 合肥市| 池州市| 南涧| 盘山县| 三穗县| 玉环县| 金溪县| 封丘县| 鲁甸县| 南靖县|