- 自己動(dòng)手寫分布式搜索引擎
- 羅剛
- 248字
- 2020-11-28 15:52:44
3.1.1 創(chuàng)建索引
先準(zhǔn)備好文檔數(shù)據(jù),然后往索引庫中加入文檔。寫入索引的過程如圖3-2所示。

圖3-2 寫入索引
創(chuàng)建索引部分骨干偽代碼。
//打開索引庫 IndexWriter writer=new IndexWriter(dir); //寫入一些文檔 writer.addDocument(doc); //關(guān)閉索引庫 writer.close();
一個(gè)Document代表索引庫中的一條記錄,也叫作文檔。要搜索的信息封裝成Document后通過IndexWriter寫入索引庫。
一個(gè)文檔有多個(gè)列,例如,標(biāo)題或者內(nèi)容列。Lucene中的一個(gè)Document對(duì)象可以包含多個(gè)列對(duì)象,叫作Field。例如,一個(gè)網(wǎng)頁可以包含“網(wǎng)址”“標(biāo)題”“正文”“修改時(shí)間”等Field。創(chuàng)建這些列對(duì)象以后,可以通過Document的add()方法增加這些列。代碼如下。
Document doc = new Document(); //創(chuàng)建網(wǎng)址列 Field f = new Field("url", "http://www.lietu.com" , Field.Store.YES, Field.Index.UN_TOKENIZED, Field.TermVector.NO); doc.add(f);
推薦閱讀
- Expert Cube Development with Microsoft SQL Server 2008 Analysis Services
- ERP沙盤模擬教程
- 中文版Illustrator 2021完全自學(xué)教程
- YUI 2.8: Learning the Library
- Puppet 2.7 Cookbook
- BIM與Unity 3D開發(fā)實(shí)例詳解
- Excel數(shù)據(jù)管理:不加班的秘密
- 綁定的藝術(shù):Maya高級(jí)角色骨骼綁定技法(第2版)
- Photoshop數(shù)碼攝影后期處理技法從入門到精通
- Apache Maven 3 Cookbook
- SOLIDWORKS中文版實(shí)用教程
- 中文版Photoshop CS6經(jīng)典自學(xué)教程
- 好學(xué)、好用、好玩的Photoshop 寫給初學(xué)者的入門書(第4版)
- Photoshop CC入門與提高(超值版)
- 中文版InDesign CC平面排版設(shè)計(jì)從入門到精通