Lucene 学习笔记(一)
2019獨角獸企業(yè)重金招聘Python工程師標準>>>
????最近,由于需要做到搜索功能,但是搜索功能里面,涉及的關系比較復雜,如果通過sql語言來查詢,效率十分低下,所以便開始研究了下java開源搜索引擎lucene?。
? ? Lucene入門起來了解其使用規(guī)則并不難,他是圍繞索引Index來進行創(chuàng)建,查詢等操作。而索引是存放在Directory中,Directory有很多種類,不過主要分成兩種:
? ? 一、存放在運行內(nèi)存中的RAMDirectory,既然放在內(nèi)存中,也就說明他的聲明周期極其短,不過,另一方面也表明他的讀取存取速度快。
? ? 二、存放在物理磁盤中的FileSwitchDirectory,?FSDirectory,?MockDirectoryWrapper,?NRTCachingDirectory ,除了FSDirectory外,其他幾種是根據(jù)環(huán)境會發(fā)揮出不同的性能的,而FSDirectory相對要智能很多,他會根據(jù)目前的環(huán)境自行決定他的確切存儲方式。
? ? 而Lucene的基本使用流程為:
? ? 一、聲明指定Directory?,如:
? ? 二、創(chuàng)建索引并放入指定Directory,如:
IndexWriter writer = null;try {writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)));writer.deleteAll();Document doc = null;doc = new Document();doc.add(...); //在此文檔添加信息屬性等writer.addDocument(doc);//創(chuàng)建文檔索引} catch (CorruptIndexException e) {e.printStackTrace();} catch (LockObtainFailedException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();} finally {try {if(writer!=null)writer.close();} catch (CorruptIndexException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}} ? ? 三、讀取索引,進行查詢:
try {IndexReader reader = IndexReader.open(directory);IndexSearcher searcher = new IndexSearcher(reader);TermQuery query = new TermQuery(new Term(指定屬性,查詢內(nèi)容)); //獲得查詢數(shù)據(jù),條數(shù)為自定義,以下為10條TopDocs tds = searcher.search(query, 10);for(ScoreDoc sd:tds.scoreDocs) {//查詢到的數(shù)據(jù)進行數(shù)據(jù)的操作}reader.close();} catch (CorruptIndexException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();} ? ? 以上為Lucene搜索的基本流程,更高效率的還要對內(nèi)容進行分詞,同義詞處理等。
轉載于:https://my.oschina.net/u/1024349/blog/147085
總結
以上是生活随笔為你收集整理的Lucene 学习笔记(一)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 四、物理优化(2)索引视图
- 下一篇: python解析AMF协议