Py之jieba:Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略
生活随笔
收集整理的這篇文章主要介紹了
Py之jieba:Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Py之jieba:Python包之jieba包(中文分詞最好的組件)簡介、安裝、使用方法之詳細攻略
目錄
jieba簡介
jieba安裝
jieba使用方法
1、進行分詞
jieba簡介
? ? ? ? ?jieba應該算得上是分詞領域的佼佼者,想要使用python做文本分析,分詞是必不可少的一個環節。
- 支持三種分詞模式:
- 精確模式,試圖將句子最精確地切開,適合文本分析;
- 全模式,把句子中所有的可以成詞的詞語都掃描出來, 速度非常快,但是不能解決歧義;
- 搜索引擎模式,在精確模式的基礎上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞。
- 支持繁體分詞
- 支持自定義詞典
- MIT 授權協議
官網github地址:GitHub - fxsjy/jieba: 結巴中文分詞
jieba安裝
pip install jieba?
好啦,大功告成,開始使用吧!
jieba使用方法
1、進行分詞
import jieba text='周杰倫(Jay Chou),1979年1月18日出生于臺灣省新北市,祖籍福建省泉州市永春縣,中國臺灣流行樂男歌手、原創音樂人、演員、導演等,畢業于淡江中學。' text_cut = jieba.cut(text, cut_all=False) print(list(text_cut))['周杰倫', '(', 'Jay', ' ', 'Chou', ')', ',', '1979', '年', '1', '月', '18', '日出', '生于', '臺灣省', '新北市', ',', '祖籍', '福建省', '泉州市', '永春縣', ',', '中國臺灣', '流行樂', '男歌手', '、', '原創', '音樂', '人', '、', '演員', '、', '導演', '等', ',', '畢業', '于', '淡江', '中學', '。']
?
?
總結
以上是生活随笔為你收集整理的Py之jieba:Python包之jieba包(中文分词最好的组件)简介、安装、使用方法之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Py之pyecharts:python包
- 下一篇: Py之SnowNLP:SnowNLP中文