- 自己動手寫分布式搜索引擎
- 羅剛
- 769字
- 2020-11-28 15:52:38
前言
搜索引擎成為人們獲取信息不可或缺的工具。大數據技術的發展推動了多機集群的分布式搜索引擎技術走向成熟。普通的機器就可以搭建分布式搜索引擎。一些開源的分布式搜索引擎系統在數據存儲、數據分析等方面的功能越來越強大。本書希望用通俗易懂的語言,讓任何對分布式搜索引擎技術感興趣的讀者都能夠有所收獲。
本書的很多內容來源于搜索引擎、自然語言處理、金融等領域的項目開發和教學實踐。在此感謝開源軟件的開發者們,他們無私的工作豐富了本書的內容。
本書的第1章介紹開發分布式搜索引擎所需要的基本算法;第2章介紹如何從頭開始自己動手寫一個簡單的全文檢索軟件包;第3章介紹Lucene的基本使用方法及其原理;第4章介紹使用JSP或者Struts 2開發搜索引擎用戶界面,以及用戶界面常用的Taglib;第5章介紹Solr實現分布式搜索引擎的解決方案——SolrCloud,以及它對SQL查詢的支持;第6章介紹如何使用基于Lucene的ElasticSearch實現分布式搜索引擎。
鑒于ElasticSearch處于快速發展中,一些新版本的具體使用情況可以加入QQ群460405445,進行討論。
本書配套的光盤中提供了相關的源代碼,有的來源于獵兔搜索多年的開發經驗積累,有的是經典算法實現。其中很多源代碼都可以直接用于項目實踐。
本書適合需要具體實現搜索引擎的程序員使用,對于信息檢索等相關領域的研究人員也有一定的參考價值,同時獵兔搜索技術團隊已經開發出以本書為基礎的專門培訓課程和商業軟件。目前的一些分布式搜索引擎軟件仍然有很多功能有待完善,作者真誠地希望通過本書把讀者帶入分布式搜索引擎開發的大門并認識更多的朋友。
感謝早期合著者、合作伙伴、員工、學員的支持,給我們提供了良好的工作基礎。在將來,希望我們的分布式搜索引擎代碼和技術能夠像雨后春筍一樣快速生長。
本書由羅剛、崔智杰編著,另外參與本書編寫的還有張曉斐、石天盈、張繼紅、張進威、劉宇、何淑琴、任通通、高丹丹、徐友峰、孫寬,在此一并表示感謝。
編者
- 中文版After Effects 2021入門教程
- Excel 數據處理與分析實例教程(第2版)
- 3ds max & VRay產品造型設計經典
- ASP.NET jQuery Cookbook
- 中文版Photoshop CS6從新手到高手·全彩版
- Linux Shell Scripting Cookbook
- Excel 2010 Financials Cookbook
- Cinema 4D基礎與實戰教程
- 數碼攝影修圖師完全手冊(第2卷)
- HBase企業應用開發實戰
- Plone 3 Theming
- Microsoft Dynamics Sure Step 2010
- SolidWorks三維設計及工程圖速成
- OpenGL 4.0 Shading Language Cookbook
- 跟著視頻學Excel數據處理:函數篇