pynlpir(ICTCLAS)初步使用
生活随笔
收集整理的這篇文章主要介紹了
pynlpir(ICTCLAS)初步使用
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
# -*- coding:utf-8 -*-
import pynlpir # 引入依賴包
pynlpir.open() # 打開分詞器
# s = 'NLPIR分詞系統(tǒng)前身為2000年發(fā)布的ICTCLAS詞法分析系統(tǒng),從2009年開始,為了和以前工作進(jìn)行大的區(qū)隔,并推廣NLPIR自然語言處理與信息檢索共享平臺,調(diào)整命名為NLPIR分詞系統(tǒng)。' # 實(shí)驗(yàn)文本
s='我想聽劉德華的笨小孩'
pynlpir.segment(s) # 默認(rèn)打開分詞和詞性標(biāo)注功能
print(pynlpir.segment(s))
pynlpir.segment(s, pos_english=False) # 把詞性標(biāo)注語言變更為漢語
pynlpir.segment(s, pos_tagging=False) # 使用pos_tagging來關(guān)閉詞性標(biāo)注
from ctypes import c_char_p
pynlpir.nlpir.AddUserWord(c_char_p("自定義詞匯".encode()))
pynlpir.close()
輸出結(jié)果:
[('我', 'pronoun'), ('想', 'verb'), ('聽', 'verb'), ('劉德華', 'noun'), ('的', 'particle'), ('笨', 'adjective'), ('小孩', 'noun')]
總結(jié)
以上是生活随笔為你收集整理的pynlpir(ICTCLAS)初步使用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jieba和thulac使用比较
- 下一篇: ImportError: No modu