官术网_书友最值得收藏!

3.1 Lucene快速入門(mén)

Lucene是一個(gè)開(kāi)放源代碼的全文索引庫(kù),完成基本功能只有1個(gè)不依賴外部程序包的jar文件。因?yàn)檫@個(gè)文件是一個(gè)核心文件,所以稱(chēng)為lucene-core-Version.jar。例如,Lucene的6.3.0版本叫作lucene-core-6.3.0.jar。可以從http://lucene.apache.org/core/下載這個(gè)jar包。

待查詢的文檔集合按詞組織成倒排索引。Lucene中的索引庫(kù)是位于一個(gè)目錄下的一些二進(jìn)制文件。Lucene中的索引庫(kù)叫作Index。和一般的數(shù)據(jù)庫(kù)不一樣,Lucene不支持定義主鍵。在Lucene中并不存在一個(gè)叫作Index的類(lèi)。通過(guò)IndexWriter來(lái)寫(xiě)索引,通過(guò)IndexReader讀索引。索引庫(kù)在物理形式上一般是位于某個(gè)路徑下的一系列文件。

先介紹如何創(chuàng)建索引庫(kù),然后介紹如何搜索索引庫(kù)。總的來(lái)說(shuō),往Lucene中放的是文檔,查詢的是詞,查詢返回的也是文檔。使用Lucene實(shí)現(xiàn)搜索的基本概念如圖3-1所示。

圖3-1 Lucene搜索的基本概念

為了對(duì)Lucene有個(gè)大體了解,先用偽代碼說(shuō)明Lucene的核心概念。

主站蜘蛛池模板: 连州市| 大渡口区| 彭阳县| 吉林省| 彩票| 昭平县| 衢州市| 积石山| 新沂市| 周至县| 张家港市| 会泽县| 朝阳市| 上蔡县| 凤翔县| 嫩江县| 德兴市| 昭觉县| 锦屏县| 特克斯县| 谢通门县| 延庆县| 航空| 丹阳市| 静安区| 鄂伦春自治旗| 犍为县| 宽甸| 汽车| 舟山市| 丹凤县| 东海县| 崇文区| 扶风县| 日照市| 海城市| 大姚县| 德兴市| 阿尔山市| 洛阳市| 花莲县|