深度学习在情感分类中的应用
-
簡介與背景
-
情感分類及其作用
-
情感分類方法
-
基于深度學習的情感分類方法研究現狀
-
面向情感分類的深度學習架構
1、基于BiLSTM的的情感分類模型
XU等人提出了一種改進的詞表示方法,將情感信息整合到傳統的TF-IDF算法中生成加權詞向量,并將加權詞向量輸入到BiLSTM中,捕獲文本上下文信息,達到更好地表示文本向量的目的。
傳統的神經網絡模型信息只能向前傳播,t的狀態只依賴于時間t之前的信息。為了使每個時刻都包含上下文信息,XU等人采用了雙向RNN模型和LSTM單元相結合的BiLSTM來捕獲上下文信息。在左圖中,首先構建了包含情感信息和分類貢獻的加權詞向量。首先,將加權詞向量作為BiLSTM的輸入,BiLSTM模型的輸出為輸入文本的表示。然后,將評論文本向量輸入前饋神經網絡分類器。最后,得到評論的情感傾向。其中,前饋神經網絡的激活函數為ReLU函數,NodeNum為LSTM隱層的節點數,同時為了防止過擬合,XU等人引入dropout機制,并將dropout的丟棄率設置為0.5。
2、SLCABG模型
YANG等人基于情感詞,結合CNN和BiGRU,提出了一種新的情感分析模型SLCABG。SLCABG結合了情感詞和深度學習技術的優點,首先,利用情感詞匯增強評論的情感特征,然后利用CNN和GRU網絡提取評論中的主要情感特征和語境特征,并利用注意機制進行權重。最后對加權的情感特征進行分類。
SLCABG模型包含嵌入層、卷積層、池化層、BiGRU層、注意層和全連接層。模型結構如圖1所示。嵌入層使用BERT模型將文本表示為一個加權詞向量矩陣,使用情感權重對單詞向量進行加權;卷積層的主要功能是提取輸入矩陣中最重要的局部特征。池化層對卷積層得到的文本特征進行壓縮,進行更深一步的特征提取,YANG等人認為在一個句子中影響最大的往往是幾個單詞或短語,因此使用k-max pooling進行特征提取。
3、ABCDM模型
Mohammad Ehsan Basiri等人提出了一種新的深度模型ABCDM。ABCDM使用嵌入、BiGRU、BiLSTM、注意力機制和CNN捕獲長依賴關系和局部特征。首先在嵌入層使用Bi-LSTM和Bi-GRU兩個并行層對任意的文本序列進行處理,提取文本的長依賴關系和后向信息。之后將注意機制應用于htLSTM和htGRU,使ABCDM能夠對文本中的不同單詞進行注意力加權。最后,對重要權重進行加權和,將其聚合為評論向量。同時,利用CNN提取信息局部特征,降低輸入數據的維數。模型最后數據輸出至具有sigmoid函數的全連接層進行分類。ABCDM架構如下圖所示:
-
基于深度學習的情感分類方法論述
Faisal Alshuwaier等人對深度學習方法進行文獻綜述,對情感分類技術的最新進展進行調查,發現遞歸神經網絡、深度信念網絡、領域-對抗網絡模型和混合神經網絡在情感分類方面效果顯著。Anisha P Rodrigues等人認為基于情感分類判斷推特推文是否為垃圾信息。首先提取推文特征并分類,而后使用決策樹、邏輯回歸、多項式納烏夫貝葉斯、支持向量機、隨機森林和貝葉斯等機器學習方法進行垃圾郵件檢測,之后使用RNN、LSTM、BiLSTM和CNN進行情感分類,其中隸屬于RNN的深度學習模型LSTM的驗證準確率達到了98.74%。
Anirban Adak等人研究了機器學習和深度學習在預測情感分類方面的工作,他們認為基于詞法和機器學習的情感分類廣泛使用但是由于缺乏可解釋性,深度學習技術使用有限,但是也沒有否認深度學習模型具有良好的性能,Anirban Adak等人認為基于深度學習的情感分類模型下一步工作應該使模型更具解釋性。
Chetanpal Singh等人提出了一種基于LSTM-RNN的深度學習方法,用于分析與COVID-19相關的推特數據。該算法基于現有的LSTM-RNN模型,使用增強的注意力機制特征轉換框架加強特征權重,與現有方法相比,本方法準確率提高了20%,可以實現對新冠肺炎疫情評論的情感分類。
RAJ PAREKH等人提出了一種DL-Gues框架進行加密貨幣價格預測,該框架首先對數據進行歸一化處理,然后將預測價格作為過去w天加密貨幣價格的輸入保存到模型中,預測w+1天的價格,直到迭代次數等于預測窗口長度,此外,該模型使用基于GRU和LSTM的混合模型解決梯度消失問題。
Ahmed Alsayat使用自定義深度學習模型,結合詞嵌入,建立基于詞嵌入和LSTM網絡的魯棒框架,學習單詞之間的上下文關系,理解冠狀病毒等相對新興單詞。加入對新興詞的權重提高情感分類精度,通過模型在亞馬遜和Yelp數據集的實驗可以證明,提出的模型的性能在分類精度方面優于其他模型。
-
使用Cornell情感分類數據集進行的情感分類方法
Sourav Das等人提出了一種利用深度神經網絡進行情感評估準確性的新方法——構建了一個深度CNN架構,能夠將具有情感標記的詞向量作為輸入,通過調整學習率和減少輸入數據的向量維度來防止過擬合,提供一個有限維度的矩陣幫助池化層學習到最好的數據特征,通過在Cornell情感分類數據集等幾個流行的開源文本語料庫進行測試發現,Sourav?Das等人提出的模型保持了整體性能的穩定性。
Erik Cambria等人提出了一個基于常識的神經符號框架——SenticNet 7,首先,通過詞匯替代的方法發現近義詞集合,其次,計算近義詞的情感相似性,為每個近義詞集選定最具代表性的術語命名,最后,通過研究各對立基元對之間的多維路徑,進一步細化基元集。SenticNet 7采用了無監督和可再現的次符號技術,如自動回歸語言模型,將自然語言轉換為一種原始語言,從而以完全可解釋和解釋的方式從文本中提取情感極性。SenticNet 7評估了包括Cornell情感分類數據集在內的多個情感分類數據集,SenticNet 7豐富的單詞特征提取能力使得其顯示了較好的準確性。
Rabeeh Karimi Mahabadi等人提出了PERFECT模型,在不依賴任何人工處理的情況下對預訓練掩碼語言模型進行少次微調,在微調期間學習新的多標記標簽嵌入,使得嵌入不僅可以從有限的數據中學習,而且可以使訓練和預測速度有效提升。在Cornell情感分類數據集中的實驗表明,PERFECT在簡單高效的同時,也優于現有的其他方法。
-
關于方法和參考文獻的討論
1、面向情感分類的深度學習架構
本文分析的3個面向情感分類的深度學習架構參考文獻信息為:
2、基于深度學習的情感分類方法論述
本文分析的5個基于深度學習的情感分類方法論述參考文獻信息為:
3、使用Cornell情感分類數據集進行的情感分類方法
總結
以上是生活随笔為你收集整理的深度学习在情感分类中的应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C语言中删除重复字母,删除C ++中的重
- 下一篇: 双月楼月饼荣获茂名在线月饼品鉴佳绩