官术网_书友最值得收藏!

前言

搜索引擎成為人們獲取信息不可或缺的工具。大數據技術的發展推動了多機集群的分布式搜索引擎技術走向成熟。普通的機器就可以搭建分布式搜索引擎。一些開源的分布式搜索引擎系統在數據存儲、數據分析等方面的功能越來越強大。本書希望用通俗易懂的語言,讓任何對分布式搜索引擎技術感興趣的讀者都能夠有所收獲。

本書的很多內容來源于搜索引擎、自然語言處理、金融等領域的項目開發和教學實踐。在此感謝開源軟件的開發者們,他們無私的工作豐富了本書的內容。

本書的第1章介紹開發分布式搜索引擎所需要的基本算法;第2章介紹如何從頭開始自己動手寫一個簡單的全文檢索軟件包;第3章介紹Lucene的基本使用方法及其原理;第4章介紹使用JSP或者Struts 2開發搜索引擎用戶界面,以及用戶界面常用的Taglib;第5章介紹Solr實現分布式搜索引擎的解決方案——SolrCloud,以及它對SQL查詢的支持;第6章介紹如何使用基于Lucene的ElasticSearch實現分布式搜索引擎。

鑒于ElasticSearch處于快速發展中,一些新版本的具體使用情況可以加入QQ群460405445,進行討論。

本書配套的光盤中提供了相關的源代碼,有的來源于獵兔搜索多年的開發經驗積累,有的是經典算法實現。其中很多源代碼都可以直接用于項目實踐。

本書適合需要具體實現搜索引擎的程序員使用,對于信息檢索等相關領域的研究人員也有一定的參考價值,同時獵兔搜索技術團隊已經開發出以本書為基礎的專門培訓課程和商業軟件。目前的一些分布式搜索引擎軟件仍然有很多功能有待完善,作者真誠地希望通過本書把讀者帶入分布式搜索引擎開發的大門并認識更多的朋友。

感謝早期合著者、合作伙伴、員工、學員的支持,給我們提供了良好的工作基礎。在將來,希望我們的分布式搜索引擎代碼和技術能夠像雨后春筍一樣快速生長。

本書由羅剛、崔智杰編著,另外參與本書編寫的還有張曉斐、石天盈、張繼紅、張進威、劉宇、何淑琴、任通通、高丹丹、徐友峰、孫寬,在此一并表示感謝。

編者

主站蜘蛛池模板: 大新县| 桑植县| 余干县| 卢湾区| 英德市| 安国市| 古蔺县| 婺源县| 阜南县| 阳城县| 海淀区| 博野县| 泰宁县| 南通市| 七台河市| 台湾省| 南木林县| 特克斯县| 永年县| 南通市| 永和县| 夹江县| 葫芦岛市| 康乐县| 莫力| 会东县| 泗阳县| 小金县| 壶关县| 固始县| 油尖旺区| 镇原县| 包头市| 谷城县| 荔浦县| 临沭县| 新郑市| 勐海县| 肃北| 灌阳县| 昭觉县|