NLP研究方向的「情感分析领域」的简单调研
情感分析領(lǐng)域相關(guān)內(nèi)容,非正式綜述,僅供參考。有些鏈接在可能在微信文章失效,請點(diǎn)擊閱讀原文獲取。
(https://blog.csdn.net/DoJintian/article/details/88356413)
簡介
情感分析或觀點(diǎn)挖掘是對人們對產(chǎn)品、服務(wù)、組織、個(gè)人、問題、事件、話題及其屬性的觀點(diǎn)、情感、情緒、評價(jià)和態(tài)度的計(jì)算研究。
現(xiàn)有研究已經(jīng)產(chǎn)生了可用于情感分析多項(xiàng)任務(wù)的大量技術(shù),包括監(jiān)督和無監(jiān)督方法。在監(jiān)督方法中,早期論文使用所有監(jiān)督機(jī)器學(xué)習(xí)方法(如支持向量機(jī)、最大熵、樸素貝葉斯等)和特征組合。無監(jiān)督方法包括使用情感詞典、語法分析和句法模式的不同方法。現(xiàn)有多本綜述書籍和論文,廣泛地涵蓋了早期的方法和應(yīng)用。
大約十年前,深度學(xué)習(xí)成為強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù),在很多應(yīng)用領(lǐng)域產(chǎn)生了當(dāng)前最優(yōu)的結(jié)果,包括計(jì)算機(jī)視覺、語音識(shí)別、NLP 等。近期將深度學(xué)習(xí)應(yīng)用到情感分析也逐漸變得流行。
情感分析的三種粒度
文檔粒度(document level):文檔級(jí)情感分類是指為觀點(diǎn)型文檔標(biāo)記整體的情感傾向/極性,即確定文檔整體上傳達(dá)的是積極的還是消極的觀點(diǎn)。因此,這是一個(gè)二元分類任務(wù),也可以形式化為回歸任務(wù),例如為文檔按 1 到 5 星評級(jí)。一些研究者也將其看成一個(gè)五類分類任務(wù)。
句子粒度(sentence level):語句級(jí)情感分類用來標(biāo)定單句中的表達(dá)情感。正如之前所討論的,句子的情感可以用主觀性分類和極性分類來推斷,前者將句子分為主觀或客觀的,而后者則判定主觀句子表示消極或積極的情感。在現(xiàn)有的深度學(xué)習(xí)模型中,句子情感分類通常會(huì)形成一個(gè)聯(lián)合的三類別分類問題,即預(yù)測句子為積極、中立或消極。
短語粒度(aspect level):也稱為主題粒度,每一個(gè)短語代表了一個(gè)主題。與文檔級(jí)和語句級(jí)的情感分類不同,aspect level 情感分類同時(shí)考慮了情感信息和主題信息(情感一般都會(huì)有一個(gè)主題)。給定一個(gè)句子和主題特征,aspect level 情感分類可以推斷出句子在主題特征的情感極性/傾向。例如,句子「the screen is very clear but the battery life is too short.」中,如果主題特征是「screen」,則情感是積極的,如果主題特征是「battery life」,則情感是消極的。
深度學(xué)習(xí)模型
文檔/句子粒度:Kim等人(2013) 提出的CNN文本分類工作,成為句子級(jí)情感分類任務(wù)的重要baseline之一;
文檔/句子粒度:基本的lstm模型加上pooling策略構(gòu)成分類模型,是通常用來做情感分析的方法;
短語粒度:Tang等人(2015) 使用兩種不同的rnn網(wǎng)絡(luò),結(jié)合文本和主題進(jìn)行情感分析;
短語粒度:Tang等人(2016) 結(jié)合memory-network,解決target-dedependent問題,這里的target理解為前面提過的aspect;
短語粒度:Chen等人(2017) 分別使用位置權(quán)重記憶和層疊attention的復(fù)合機(jī)制,建模target詞和文本間的相互交互關(guān)系,以解決短語級(jí)情感分類問題;
短語粒度:Schmitt1等人(2018) 將aspect和polarity結(jié)合在一起進(jìn)行分類任務(wù)訓(xùn)練,得到情感分析的模型;
現(xiàn)在流行模型:大規(guī)模語料預(yù)訓(xùn)練(詞向量/Elmo/GPT/Bert)+ 深度學(xué)習(xí)分類器(lstm/cnn/transformer),一個(gè)很好的示例見AI Challenger 2018:細(xì)粒度用戶評論情感分類冠軍思路總結(jié)。
相關(guān)數(shù)據(jù)
情感詞典
詞性字典1 ? 詞性字典2
大連理工大學(xué)中文情感詞匯本體庫
清華大學(xué)李軍中文褒貶義詞典
知網(wǎng)情感詞典
情感數(shù)據(jù)集
15 Free Sentiment Analysis Datasets for Machine Learning
大眾點(diǎn)評細(xì)粒度用戶評論情感數(shù)據(jù)集
汽車行業(yè)用戶觀點(diǎn)主題及情感識(shí)別
電商評論情感數(shù)據(jù)
酒店評論語料
SemEval-2014 Task 4數(shù)據(jù)集
Citysearch corpus 餐館評論數(shù)據(jù)
NLPCC2014評估任務(wù)2_基于深度學(xué)習(xí)的情感分類
NLPCC2013評估任務(wù)_中文微博觀點(diǎn)要素抽取
NLPCC2013評估任務(wù)_中文微博情緒識(shí)別
NLPCC2013評估任務(wù)_跨領(lǐng)域情感分類
NLPCC2012評估任務(wù)_面向中文微博的情感分析
康奈爾大學(xué)影評數(shù)據(jù)集
其他資源
[Sentiment Analysis with LSTMs in Tensorflow](https://github.com/adeshpande3/LSTM-Sentiment-Analysis ?)
Sentiment analysis on tweets using Naive Bayes, SVM, CNN, LSTM, etc.
Chinese Shopping Reviews sentiment analysis
AI Challenger 2018:細(xì)粒度用戶評論情感分類冠軍思路總結(jié)
文獻(xiàn)資料
文本情感分析綜述(騰訊語義團(tuán)隊(duì))
Deep learning for sentiment analysis: A survey
情感分析資源大全
Tang D, Qin B, Liu T. Aspect level sentiment classification with deep memory network[J]. arXiv preprint arXiv:1605.08900, 2016.
Kim Y. Convolutional neural networks for sentence classification[J]. arXiv preprint arXiv:1408.5882, 2014.
https://blog.csdn.net/DoJintian/article/details/88356413
請關(guān)注和分享↓↓↓?
機(jī)器學(xué)習(xí)初學(xué)者
QQ群:727137612
(注意:本站有7個(gè)qq群,加入過任何一個(gè)的不需要再加)
本站的知識(shí)星球ID:92416895
往期精彩回顧
良心推薦:機(jī)器學(xué)習(xí)入門資料匯總及學(xué)習(xí)建議(2018版)
黃海廣博士的github鏡像下載(機(jī)器學(xué)習(xí)及深度學(xué)習(xí)資源)
吳恩達(dá)老師的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)課程筆記打印版
機(jī)器學(xué)習(xí)小抄-(像背托福單詞一樣理解機(jī)器學(xué)習(xí))
首發(fā):深度學(xué)習(xí)入門寶典-《python深度學(xué)習(xí)》原文代碼中文注釋版及電子書
科研工作者的神器-zotero論文管理工具
機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)
機(jī)器學(xué)習(xí)必備寶典-《統(tǒng)計(jì)學(xué)習(xí)方法》的python代碼實(shí)現(xiàn)、電子書及課件
吐血推薦收藏的學(xué)位論文排版教程(完整版)
機(jī)器學(xué)習(xí)入門的百科全書-2018年“機(jī)器學(xué)習(xí)初學(xué)者”公眾號(hào)文章匯總
總結(jié)
以上是生活随笔為你收集整理的NLP研究方向的「情感分析领域」的简单调研的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Numpy练习题100题-提高你的数据分
- 下一篇: TIANCHI天池-OGeek算法挑战赛