双向LSTM中文微博情感分类项目
生活随笔
收集整理的這篇文章主要介紹了
双向LSTM中文微博情感分类项目
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
雙向LSTM中文微博情感分類項目
- 1、數據集說明
- 2、雙向LSTM中文微博情感分類項目實戰
1、數據集說明
??這里完成一個中文微博情感分類項目。這里我使用的數據集是從新浪微博收集的 12 萬條數據,正負樣本各一半。標簽中 1 表示正面評論,0 表示負面評論。數據來源為https://github.com/SophonPlus/ChineseNlpCorpus/blob/master/datasets/weibo_sen ti_100k/intro.ipynb如果你有其他數據的話,也可以使用其他數據。
??這一次我們使用的數據需要自己做處理,所以我們需要對句子進行分詞,分詞后再對每 個詞根據頻率來進行編號。這里我們要使用的分詞工具是結巴分詞,結巴分詞是一個很好用 的中文分詞工具,安裝方式為打開命令提示符,然后輸入命令:
pip install jieba??安裝好以后在 python 程序中直接 import jieba 就可以使用了。
2、雙向LSTM中文微博情感分類項目實戰
??上一博客我們講解了 CNN 在中文微博情感分類項目中的應用,這一篇文章我們改用 LSTM 來完成,前期數據處理部分都是一樣的流程,只有建模部分的程序
總結
以上是生活随笔為你收集整理的双向LSTM中文微博情感分类项目的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jqprint 分页打印_javascr
- 下一篇: zigbee里面的CC2530外设驱动代