NRC词语情绪词典和词语色彩词典
Python&Stata數據采集與數據分析實證前沿寒假工作坊??現在開始招生了,有興趣的同學和老師可以戳進來了解
情緒和情感詞典 是由加拿大國家研究委員會(簡稱NRC)的專家創建。該詞典·具有廣泛的應用程序開發,可以在多種環境中使用,例如情緒分析,產品營銷,消費者行為,甚至是政治活動分析。
該技術使用一系列單詞來幫助識別情緒,情感,并分析標簽,表情符號和單詞顏色的關聯。這些詞典包含英文單詞的條目,可用于分析英文文本。
資源文件夾目錄(文章末尾有完整的資源可供下載)
AutomaticallyGeneratedLexicons
NRC-Affect-Intensity-Lexicon
NRC-Colour-Lexicon-v0.92
NRC-Emotion-Lexicon-v0.92
NRC-VAD-Lexicon
但是我覺得目前對咱們經管專業最有用可能是
NRC-Colour-Lexicon-v0.92
NRC-Emotion-Lexicon-v0.92
我們可以使用上面兩個詞典度量文本的情緒信息,也可以分析文本的色彩信息。
詞語的色彩
色彩是成功傳遞信息的重要組成部分,無論是在銷售商業產品(Sable和Akcay,2010),設計網頁(Meier,1988;Pribadi等,1990)還是可視化信息(Christ,1975)中 ;Card等,1999)。由于實際概念與某些顏色類別(例如,紅色危險和粉紅色柔和度)相關聯,因此使用適當的顏色來補充語言和非語言信息會帶來很多好處,包括:
加強訊息(改善語義連貫性)
減輕接收者的認知負擔
快速傳達信息
喚起所需的情緒反應
例如考慮在停車標志中使用紅色,駕駛員能夠更快地識別該標志,并且會引起與危險有關的潛意識情緒,同樣,使用紅色標注高犯罪率的區域是很好地使用顏色的例子。另一方面,不恰當的使用顏色可能更有害于理解(Marcus,1982;Meier,1988)。
大多數語言中許多表達情感的詞語都有涉及色彩的表達, 在英語中的例子包括:
嫉妒的綠色
貴族的藍色血統
牧場的綠色(更好的大道)
黃腹(怯co的)
紅地毯(特殊處理)
透過玫瑰色眼鏡看(樂觀)。
此外,不斷出現新的表達方式,例如灰色和比安卡·馬斯登(Bianca Marsden)的詩《混亂》中的不確定性。因此,概念-顏色關聯的知識 對于自動自然語言系統(例如,文本含義,釋義,機器翻譯和情感分析)也可能有用。
當顏色是單詞所指概念的顯著特征時,或者因為該單詞與此類概念相關,則單詞與顏色具有很強的關聯性。許多概念-顏色關聯,例如天鵝與白色和蔬菜與綠色,都涉及物理實體。但是,即使是抽象的概念和情感也可能具有與社會相關的色彩(誠實–白色,危險–紅色,喜悅–黃色,憤怒–紅色)。此外,許多協會是特定于文化的(Gage,1969;Chen,2005)。例如,在亞洲大部分地區,繁榮與紅色有關。
不幸的是,沒有一個詞庫能夠捕獲概念-顏色的關聯,并且仍然存在許多問題,例如人類對這些關聯的共識程度以及物理概念是否更可能具有顏色關聯比抽象的我們期望單詞-顏色關聯在文本和語音中表現為共現,但是還沒有研究表明單詞在多大程度上與關聯的顏色共存,而不是與其他顏色共存。
研究發現:
超過30%的術語具有強烈的顏色關聯(第4節)
約33%的詞庫類別具有很強的顏色關聯(第5節)。
抽象術語幾乎與物理實體一樣具有顏色關聯(第6節)。
情緒和極性與顏色有很強的聯系(第7節)。
詞色關聯在WordNet中表現為緊密(程度較小),在文本中表現為較高的同時出現率(程度較大)(第8節)。
色彩詞典截圖
詞語顏色詞典目前只有英文版,截圖如下
情緒詞典
情緒通常通過不同的面部表情來表達(亞里士多德,1913;拉塞爾,1994)。不同的情感也通過不同的語言表達。例如
愉悅和好吃表明喜悅的情緒
憂郁和哭泣表明悲傷
呼喊和沸騰表明憤怒
等等
本情緒詞典支持包括英語、法語、阿拉伯語、中文和西班牙語等在內的105種語言。
情緒詞典截圖
情緒詞典是基于英文數據,但擴展為105種語言。如下圖,excel有105列+9列,其中前105列是同一個意思在105種語言但不同表達。
后9列是積極、消極及7種情緒(喜怒哀樂愁怨恨)
http://sentiment.nrc.ca/lexicons-for-research/ [1]Saif, Mohammad. "Colourful Language: Measuring Word-Colour Associations, 2011a." In Proceedings of the ACL 2011 Workshop on Cognitive Modeling and Computational Linguistics (CMCL). 2011. [2]Mohammad, Saif M., and Peter D. Turney. "Crowdsourcing a word–emotion association lexicon." Computational Intelligence 29, no. 3 (2013): 436-465.
近期文章
精選課程 | Python文本數據分析實戰(學術)
Python爬蟲與Stata應用能力提升與實證前沿 ?寒假工作坊
使用Python讀取圖片中的文本數據
Loughran&McDonald金融文本情感分析庫
股評師分析報告文本情感分析預測股價
如何使用seaborn繪制組合圖
代碼不到40行的超燃動態排序圖
使用Python自動生成事件分析圖譜
使用分析師報告中含有的情感信息預測上市公司股價變動
日期數據操作第1期 datetime庫
日期數據操作第2期 pandas庫
史上最大規模1.4億中文知識圖譜開源下載
【公開視頻課】Python語法快速入門
【公開視頻課】Python爬蟲快速入門
文本數據分析文章匯總(2016-至今)
當文本分析遇到亂碼(à??'a?£')à??怎么辦?
當pandas遇上數據類型問題
如何理解pandas中的transform函數
一行pandas代碼生成啞變量
Python最被低估的庫,用好了效率提升10倍!
情緒及色彩詞典獲取方式,請在公眾號后臺回復關鍵詞“20191216” ,
如果想做文本分析
可購買網課?| Python文本數據分析實戰(學術)?
或參加Python&Stata數據采集與數據分析實證前沿寒假工作坊??
總結
以上是生活随笔為你收集整理的NRC词语情绪词典和词语色彩词典的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python之进程 3 - 进程池和mu
- 下一篇: 微信小程序学习打卡(2)