搜索引擎技術(shù)與發(fā)展
本書主要介紹如何使用Java語言開發(fā)搜索引擎,包括搜索引擎技術(shù)入門,使用Java開發(fā)網(wǎng)絡(luò)爬蟲,實(shí)現(xiàn)從文檔中提取索引內(nèi)容,中文分詞的原理與實(shí)現(xiàn),在Linux服務(wù)器端開發(fā)Solr應(yīng)用,SpringBoot微服務(wù)框架實(shí)現(xiàn)的后端,以及React框架實(shí)現(xiàn)的前端等內(nèi)容。第1章主要介紹各種類型的搜索引擎和開發(fā)搜索引擎可以借助的軟件工具;第2章主要介紹網(wǎng)絡(luò)爬蟲開發(fā)和數(shù)據(jù)存儲(chǔ);第3章主要介紹從HTML文件中提取文本,以及從PDF、Word等非HTML文件中提取文本;第4章主要介紹Lucene中的中文分析器的原理與實(shí)現(xiàn);第5章主要介紹Solr索引庫的創(chuàng)建與維護(hù),以及Solr的查詢解析器;第6章主要介紹Web方式搜索結(jié)果界面的實(shí)現(xiàn);第7章主要介紹如何使用SolrCloud實(shí)現(xiàn)分布式搜索。
·4.4萬字