solr学习之(七)_学习solr的理由(solr的特点和应用领域)
?Solr是一個可伸縮性的、能夠即時部署的、致力于信息檢索的、可以處理海量信息的、以處理自然語言文本為中心的、檢索結(jié)果按相關(guān)性排序的企業(yè)級搜索引擎。
Solr處理的業(yè)務(wù)需求有以下4個特點(diǎn):
1、無結(jié)構(gòu)化的自然語言文本為中心;
2、信息瀏覽占主導(dǎo)地位的用戶需求;
3、以Document這種扁平化并且獨(dú)立的結(jié)構(gòu)組織信息(區(qū)別與關(guān)系型數(shù)據(jù)庫);
4、要求組織成的數(shù)據(jù)模式靈活多變(不像數(shù)據(jù)庫表一樣要求統(tǒng)一的字段)。
對solr的誤解:
1、? Solr是一個類似于Google或者Bing的全文檢索引擎,。
2、? Solr是與搜索引擎優(yōu)化(SEO)相關(guān)聯(lián)的。
Solr通過schema.xml的方式來配置Filed,與Lucene相比,這種方式更為靈活。特別是在團(tuán)隊開發(fā)中,更易于團(tuán)隊協(xié)同作戰(zhàn)。而且solr還提供了Copy Field和Dynamic Filed這兩種Lucene沒有的Filed,這使得文檔建模更為靈活,功能更加強(qiáng)大。
作為一個Web應(yīng)用程序,solr可以輕松地部署在Jetty、Tomcat等Servlet服務(wù)器上。
很多時候,千言萬語,比不上一幅圖來的直接和易懂(下圖截自于Solr In Action)。
我們知道,應(yīng)用程序的架構(gòu)應(yīng)當(dāng)靈活以適應(yīng)復(fù)雜多變的需求。Solr提供了這樣一種方式來滿足這一需求:多核。換句話說,同一個服務(wù)器上可以有多個Index,每個core獨(dú)立地維護(hù)一個Index。
作為一個功能復(fù)雜的應(yīng)用,solr提供插件的方式來管理功能模塊。這些功能模塊都配置在solrconfig.xml里面,這意味著你可以制定符合自己業(yè)務(wù)的組件來替換solr原有組件,只需要實(shí)現(xiàn)相應(yīng)的接口就可以了,比如中文分詞就是被替換得最頻繁的Text Analysis組件。
?????? Solr繼承了Lucene的全部優(yōu)點(diǎn),并且可以部署在多服務(wù)器上。當(dāng)并發(fā)量增加時,特別是企業(yè)快速發(fā)展時,通過solr的緩存組件和多核(multicore)機(jī)制向外擴(kuò)展,企業(yè)可以輕松應(yīng)對這種變化帶來的壓力。
??? Solr還提供了備份的方式來進(jìn)行故障轉(zhuǎn)移,當(dāng)一個服務(wù)器宕機(jī)了,solr可以對request進(jìn)行重定向。這種容錯機(jī)制使得solr的穩(wěn)定性有了很好的保證。特別是solr4引入了solrcloud,solrcloud底層用Zookeeper來實(shí)現(xiàn),具有以下新的特性:集成化的配置、解決了單點(diǎn)故障的分布式索引、自動容錯、查詢時自動負(fù)載均衡、近實(shí)時搜索。
Solr提供了:拼寫檢查、自動補(bǔ)全、結(jié)果分類、自動文摘、關(guān)鍵詞高亮顯示、檢索結(jié)果分頁、緩存等搜索引擎必不可少的功能。同時,也提供的地理位置檢索這一有特色的功能。換句話說,使用solr,你可以無壓力地構(gòu)建一個企業(yè)級的搜索引擎。
總結(jié)
以上是生活随笔為你收集整理的solr学习之(七)_学习solr的理由(solr的特点和应用领域)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 年季报
- 下一篇: 总结网站调用Flash的几种方法【转】