python 笔记:nltk (标记英文单词词性等)
生活随笔
收集整理的這篇文章主要介紹了
python 笔记:nltk (标记英文单词词性等)
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
1 單詞切分
import nltkcontent = 'She sells seashells on the seashore. The seashells she sells are seashells, she is sure.'tokens = nltk.word_tokenize(content) print(tokens) #['She', 'sells', 'seashells', 'on', 'the', 'seashore', '.', 'The', 'seashells', 'she', 'sells', 'are', 'seashells', ',', 'she', 'is', 'sure', '.']1.1 詞性劃分
pos_tags = nltk.pos_tag(tokens) print(pos_tags) ''' [('She', 'PRP'), ('sells', 'VBZ'), ('seashells', 'NNS'), ('on', 'IN'), ('the', 'DT'), ('seashore', 'NN'), ('.', '.'), ('The', 'DT'), ('seashells', 'NNS'), ('she', 'PRP'), ('sells', 'VBZ'), ('are', 'VBP'), ('seashells', 'NNS'), (',', ','), ('she', 'PRP'), ('is', 'VBZ'), ('sure', 'JJ'), ('.', '.')] '''?1.1.1 詞性表
2 詞性還原
import nltk.stem as ns# 詞型還原:復數(shù)名詞->單數(shù)名詞 ;分詞->動詞原型 lemmatizer = ns.WordNetLemmatizer()word = 'leaves' # 將名詞還原為單數(shù)形式 #'n'表示是一個名詞(noun) n_lemma = lemmatizer.lemmatize(word, pos='n') print(n_lemma) #leaf# 將動詞還原為原型形式 #'v'表示是一個動詞(verb) v_lemma = lemmatizer.lemmatize(word, pos='v') print(v_lemma) #leave 《新程序員》:云原生和全面數(shù)字化實踐50位技術專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的python 笔记:nltk (标记英文单词词性等)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python笔记 xpinyin
- 下一篇: python笔记:jieba(中文分词)