搜索引擎学习(四)中文分词器
生活随笔
收集整理的這篇文章主要介紹了
搜索引擎学习(四)中文分词器
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
一、簡介
分詞原理
常見的分詞器(中文分詞場景不推薦用)
StandardAnalyzer(官方推薦的分詞器):英文分詞效果比較好,無法對中文進行正確分詞。(單字分詞,對中文分詞會一個字一個字的分)
CJKAnalyzer(中日韓聯(lián)合分詞器):二分法分詞,按兩個字進行切分
smartChineseAnalyzer:對中文支持較好,但擴展性差,擴展詞庫,禁用詞庫和同義詞庫等不好處理
第三方中文分詞器(中文支持效果比較好,中文分詞場景推薦使用)
IK Analyzer:目前較為推薦的中文分詞器
二、IK Analyzer分詞器
使用方式
?
?
?
?
?PS:搜索時使用的分詞器要與索引時使用的分詞器一致!
轉(zhuǎn)載于:https://www.cnblogs.com/riches/p/11448059.html
總結(jié)
以上是生活随笔為你收集整理的搜索引擎学习(四)中文分词器的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 搜索引擎学习(五)Lucene操作索引
- 下一篇: 一些日期的知识