【论文阅读】Computational Personality: A Survey 计算性格学综述
文章目錄
- 摘要
- 1. 引言
- 2. 計算性格學研究框架
- 2.1 性格學理論基礎
- 2.1.1 性格分類模型
- 2.1.2 性格計算(測量)方法
- 2.2 計算性格學研究框架
- 3. 計算性格學研究
- 3.1 性格預測
- 3.1.1 基于大五模型的性格預測
- 3.1.2 基于MBTI性格量表的性格預測
- 3.1.3 小結
- 3.2 抑郁檢測
- 3.2.1 基于線下問卷的抑郁檢測
- 3.2.2 基于社交媒體的抑郁檢測
- 3.2.3 總結
- 3.3 自殺檢測
- 3.3.1 基于問卷的自殺風險檢測
- 3.3.2 基于官方統計數據的自殺風險檢測
- 3.3.3 基于社交媒體的自殺風險檢測
- 3.3.4 小結
- 3.4幸福感評估
- 3.4.1 以量表為主的早期研究
- 3.4.2 以文本為主的近期研究
- 3.4.3 小結
- 4. 技術評測及其資源
- 4.1性格預測的相關技術評測及其資源
- 4.2 抑郁檢測的相關技術評測及其資源
- 4.3 自殺檢測的相關評測及其資源
- 4.4 幸福感評估的相關評測及其資源
- 5. 可解釋性與道德問題
- 6. 結論
- 參考文獻
- TODO List
大連理工大學信息檢索研究室楊亮,李樹群,林鴻飛等。
原文來自:《Computational Personality: A Survey》Soft Computing (2022).
原文鏈接: paper
參考:深度閱讀 | 計算性格學綜述
摘要
Personality is a set of stable and tendentious behaviors, thoughts and emotions. How to measure personality more conveniently and accurately has always been a problem for scholars in related fields. With the rapid development of computer technology and the widespread popularity of social media in recent years, the research of computational personality has attracted wide attention of researchers in Computational Linguistics and psychology. Various methods, from statistical methods in psychology to machine learning and then to deep learning, have been proposed to deal with different areas of computational personality. In this paper, we first summarize the research framework of computational personality, and then review the current research progress of computational personality from the aspects of personality prediction, depression detection, suicide detection and happiness assessment, and provide the corresponding research resources for reference. Finally, we provide some possible research directions.
性格是一組穩定的、有傾向性的行為、思想和情緒。如何更方便準確地測量性格一直是相關領域學者面臨的難題。近年來,隨著計算機技術的飛速發展和社交媒體的廣泛普及,計算性格學的研究引起了計算語言學和心理學研究人員的廣泛關注。從心理學中的統計方法到機器學習再到深度學習,計算性格學研究方法也得到了進一步發展。本文首先總結了計算性格學的研究框架,然后從性格預測、抑郁檢測、自殺檢測和幸福感評估等方面回顧了當前計算性格學的研究進展,并提供相應的研究資源以供參考。最后,思考了一些可能的研究方向。
1. 引言
性格是人類個體特征的高度概括,對人們的日常行為和主觀認知起到關鍵的指導作用,每個個體獨特的性格特征會對其日常生活產生深遠的影響,因此,對于性格的研究一直以來都是心理學等領域的重要研究課題。在心理學上不同學者對于性格的含義有著不同的詮釋,Funder[1]將性格定義為個體的思維、情感和行為特征模式,以及隱藏在這些背后的心理機制,De Young等[2]認為性格是一個描述人類對各種類型的環境刺激的持續行為反應的處理系統,而心理學界一種普遍的觀點認為性格是一個人所具有的相對一致的心理結構、行為特征的集合。由此可見,個體性格會決定一個人的行為模式,對于個體行為、群體行為甚至社會發展均會產生一定影響,性格分析方面的研究在心理學、認知學和計算機科學等多個領域具有廣泛的應用前景,相關應用包括抑郁癥的檢測、自殺的早期監測、犯罪嫌疑人的識別、婚姻狀態的改善、求職信息的匹配等,因此,性格分析研究有著重大的學術意義和應用價值。
傳統心理學對于性格的研究一般采用問卷法和測驗法,通過制定心理學量表,采集個體的性格數據開展性格分析,由于該過程需要大量人工參與,采集的樣本數量十分有限,性格分析研究有待進一步深入。隨著互聯網的廣泛普及,特別是社交媒體的盛行,給人們的社會交往方式帶來了全新的變革,也為性格分析研究提供了充足的數據儲備。人們的日常網絡社交行為可以很大程度上反映人們的個體性格,這種社交模式既平行于現實社會,又與現實社會緊密相連,由于社交媒體中的個體行為和狀態更容易被記錄和獲取,因此基于互聯網數據的用戶性格分析成為相關領域的重要研究內容,該研究領域被稱為計算性格學。
計算性格學旨在將計算方法應用于性格分析研究,通過數據采集、特征抽取及機器學習算法等手段,挖掘用戶的個體行為特征和社會交往模式,進而對互聯網用戶性格進行建模,挖掘出用戶的個人屬性,用于更為精準有效的心理學分析。計算性格學將性格理論和社交媒體分析有機結合,基于深度學習等人工智能關鍵技術對社交媒體用戶的性格進行分析和預測,并將用戶性格信息應用于個性化推薦、用戶心理預警和不良言論檢測等領域,對心理學和社交媒體計算等領域有著十分重要的研究價值,(locate a gap) 由于該領域是多學科交叉的新興領域,相關研究存在諸如數據篩選和隱私保護等諸多難題和挑戰,相關研究亟待深入開展。
本文旨在全面介紹計算性格及其最新進展。首先概述計算性格學的研究框架,總結從資源到下游應用的完整研究過程。然后,重點關注計算性格學的四個方向:性格預測、抑郁檢測、自殺檢測和幸福感評估。這些方向是計算性格學的發展趨勢,受到了廣泛關注。從以上四個方向梳理了計算性格的相關研究,介紹了計算性格學的研究進展、主要挑戰和未來的可行性研究。之后,回顧計算性格學研究和相關競賽中常用的數據資源。由于計算性格學是一門涉及多個交叉學科的新興研究,在數據篩選、隱私保護等方面仍存在困難和挑戰,因此簡要討論了道德問題和模型的可解釋性。
本文的其余部分安排如下。第 2 節介紹計算性格學研究的總體框架。第 3 節詳細梳理和比較計算性格學四個子領域的現有工作。第 4 節回顧計算性格學研究中常用的數據資源。第 5 節討論計算性格學研究的倫理問題和可解釋性。第 6 節是本文的結論。
2. 計算性格學研究框架
2.1 性格學理論基礎
2.1.1 性格分類模型
心理學對個體差異的研究誕生了很多理論,常見的性格分類模型主要有大五性格模型(Big Five Model)和MBTI(Myers-Briggs Type Indicator)等。
大五性格模型是最受計算性格分析研究者們歡迎的模型,它是現在心理學中描述最高級組織層次的五個方面的性格特征,這五大性格特征構成了人的主要性格。總體上可以分為五大性格特征:開放型(Openness to Experience)、外傾型(Extraversion)、神經型(Neuroticism)、嚴謹型(Conscientiousness)、隨和型(Agreeableness)。具體各個性格維度的特征如下表所示。大五模型的產生不僅使傳統心理學對個體差異的研究更精確化,也為性格分析與計算機領域的結合提供了重要的理論基礎。一方面,它反映了性格模型在性格心理學中的主宰地位,另一方面,該模型用數值計算性格類型,這便于通過計算機進行數據處理[3]。
Myers-Briggs Type Indicator,簡稱MBTI,是另一種常見的有代表性的模型,它是基于量表的性格測評模型,其理論原型是分析心理學的創始者Carl G Jung的性格類型說[4]。該模型將人的性格分為四個維度,外向和內向(E/I)、感覺和直覺(N/S)、理性和感性(T/F)、主觀和客觀(J/P)。四個維度如同四把標尺,每個人的性格都會落在標尺的某個點上。取每個維度上的偏好字母,組成了16種不同的性格。目前有很多 性格測試網站可以支持使用MBTI測量人的性格。心理學界認為MBTI理論過于理想化,存在缺陷,測量結果不可靠,而且同一個人不同時刻的測量結果也不同。相比之下,大五模型是更好的性格測量工具。
表2.2 MBTI量表
2.1.2 性格計算(測量)方法
對應不同的性格理論,產生了不同測量性格的方法,傳統的性格測量方法包括自陳量表(self-report inventory),如明尼蘇達多相性格測試(MMPI)、卡特爾16種性格因素測驗(16PF),艾森克性格問卷(EPQ)、愛德華個性偏好量表(EPPS)加州心理問卷(CPI)等。
但傳統的性格測量方法需要測量人員的輔助以及被測量者的高度配合,測量結果的準確性并不能完全保證。隨著社交媒體的流行,研究者們看到根據用戶在社交媒體中的行為來計算其性格特征的可行性,將諸如自然語言處理等技術與心理學相結合,利用統計學,機器學習如支持向量機、線性回歸等,以及基于深度學習的相關方法對文本進行分析,衍生了性格預測、自殺檢測、抑郁檢測、幸福感評估等研究方向。
常用的分析數據多為文本數據,但近來不少研究者們開始利用多模態數據及處理技術,將聲音信息、視頻信息等與文本信息相結合,來提高性格計算的有效性。
2.2 計算性格學研究框架
本文以心理學領域的性格理論為基礎,對計算性格學研究展開綜述,計算性格學的整體研究框架如圖1所示。在資源層,計算機性格學以互聯網中的社交媒體為數據來源,同時借鑒自然語言處理中的多種語義資源,針對用戶性格構建計算模型(情感詞典、文本語料庫);在理論層,計算性格學以心理學中的大五性格和相關性格理論為指導,將性格理論融入計算模型的構建環節,實現面向心理學的計算性格分析與挖掘;在算法層,計算性格學采用統計機器學習和深度學習方法,基于社交媒體數據構建性格分析與預測模型;在應用層,將相關計算性格分析模型應用于更多細粒度的性格分析研究方向,如抑郁檢測、自殺檢測和幸福感評估等,以深入探索計算性格學在相關任務中的應用模式;在平臺層,通過構建計算性格學分析平臺,對互聯網用戶性格展開深入的分析和應用,實現精準有效的用戶建模(精神疾病診斷、個性化推薦、用戶畫像)。
3. 計算性格學研究
隨著物質需求的增長,生活壓力的增大,人們的心理健康,越來越受到重視,但由于目前民眾仍對心理疾病等存在歧視和誤解,初期患有精神疾病的患者,羞于尋醫,而導致病情發展到不可收是的地步,因而造成不幸。計算性格學研究的產生就是為了更好地了解人們的心理健康狀態,以達到早發現,早治療的目的。在計算性格學研究中,以性格預測、抑郁檢測、自殺檢測和幸福感評估四個方面對人們的心理健康狀態進行了深入研究,以下為這四方面分別的闡述。
3.1 性格預測
性格預測有很多應用方向。一個人的性格不同,所喜愛瀏覽的內容也不盡相同,因此可以用來輔助構建推薦系統,如對于目前紅火的電商業務,可以通過分析一個人的性格給他推薦適合的商品;性格不同會導致不同的行為,例如“神經型”的性格特征往往與“恐懼”、“悲傷”、“憤怒”等存在顯著相關性,因此這種性格類型的人可能存在較大概率的抑郁傾向,甚至會導致自殺行為的產生。
近年來,隨著移動設備的普及,社交媒體已經成為一種流行的信息交流和社會互動的手段。社交媒體用戶的個性信息可以用于分析人群行為和構建推薦系統,這使得性格預測研究者們常常從用戶量大的社交軟件入手,如Facebook、Twitter等社交平臺。這些社交媒體用戶量龐大,用戶信息豐富,吸引了大量研究者的注意。常用的性格標準如大五模型等,因此性格預測問題也就轉化為一個分類問題。
3.1.1 基于大五模型的性格預測
早期的基于大五模型進行性格預測的代表性工作有Argamon[5](2005)等人使用支持向量機(SVM)算法,并加入了詞匯特征,對大五模型中“神經型”和“外傾型”的性格進行預測。數據集采用得克薩斯大學奧斯汀分校的學生在1997年至2003年間所寫的文章,實現對這些學生的五因素性格測量。實驗結果證明了詞匯特征對性格分析(神經型性格)具有一定的適用性,但對外傾型性格的預測結果準確性并不樂觀。
除收集學生文章文本來構建數據集外,也可采用社交媒體的開源數據進行性格預測,如Zheng[6](2016)等人采用myPersonality2(該數據集所在網站現已停止分享數據)進行實驗,提出了一種結合信息增益與語義特征的性格預測方法對文本提取了情感詞、詞性、時態等特征,對其進行特征選擇和加權,同時將文本內容映射為本體概念并計算語義相關度,最后基于詞的特征和語義特征,運用支持向量機(SVM)、K最近鄰(KNN)、樸素貝葉斯(NB)等機器學習算法進行性格預測,相比于一般基于LIWC構造特征方法具有更好的預測效果。Liu[7](2017)等人在大五模型理論的基礎上,針對微博社交媒體,提出一種基于用戶行為信息來預測性格的方法,基于線性回歸的方法構建了用戶性格預測模型,實驗的正確率達到了78.5%。
上述研究均采用文本信息作為實驗數據,另有研究者認為社交媒體上的互動行為(如轉發、點贊等)也可以作為性格預測的數據分析基礎。如Michal等人[8](2013)認為像Facebook中Likes之類的數字記錄可以表征一個人的個人屬性,如性取向、種族、宗教、政治觀點、個性特征、智力、幸福感等。這項分析基于58000多名志愿者提供的其在Facebook上的Likes數據、詳細個人資料以及一些心理測試的結果,模型采用降維的方式對數據進行預處理,然后輸入logistic回歸/線性回歸,預測Likes的個體性格特征。該模型正確區分了數據集中88%的同性戀和異性戀男性,95%的非裔美國人和美國白人,85%的民主黨人和民主黨人。對于“開放性”性格特征,預測準確度接近標準性格測驗的準確度。
Jennifer等人[9](2011)通過分析用戶在Facebook上的公開信息來準確預測用戶的個性,如姓名、教育水平、婚姻狀況、社交網絡的密度(即與友人之間的親密程度)、形容最喜愛活動的用詞數量、加入群組的數量以及政治傾向等。實驗結果顯示高斯算法和M5算法預測用戶的RMSE性格分數值低于0.13,可以準確預測用戶性格。
有研究者用圖像來分析預測性格,比如用戶的頭像等信息。如 Fabio[10](2014)等人對Facebook用戶的頭像進行分析,他們認為性格與個人交互風格有關,頭像圖片傳達了大量有關與用戶的信息。最后,使用了不同的機器學習算法來測試圖像特征在預測性格和交互風格特征方面的有效性,經過有效訓練的機器學習算法能比人類更準確的識別頭像所屬用戶的性格特征。
多模態技術在性格預測上的研究也越來越廣泛,如Marcin等人[11](2016)認為在許多個性化檢索和推薦系統中,用戶的個性特征是非常重要的。因此,他們集成了文本、圖像等特征并對兩個不同的SNS(Twitter和Instagram網絡)同時進行分析,使得每種性格特質的預測誤差得到一致的降低。
Onno等人[12](2018)利用多模態融合的技術,基于大五性格模型利用語音、文本,以及視頻(主要是臉部特征)對性格進行預測。對于語音數據,使用了聲學(acoustic)和韻律(prosodic)信息,將原始聲波輸入至卷積神經網絡(CNN)中;對于視頻數據,從每個視頻中隨機抽取一幀,只通過外觀特征識別性格,利用VGG-FACECNN模型對圖像提取表示特征;對于文本信息,利用word2vec轉化為詞向量后輸入至CNN模型。實驗結果顯示其多模態融合技術比單個模態的最高性能(視頻特征)提升了9.4%。
Aslan[13](2019)等人提出了一種基于深度學習的多模態方法,從視頻中提取說話風格、面部表情、身體動作、語言因素等與性格有關的特征,經過預訓練的深度卷積網絡(Resnet和VGGish)提取高層特征,并使用LSTM集合時間信息。實驗結果在大五模型的五個特征的平均準確率達到了當年的最優結果。
現今越來越多的學者基于大五性格模型進行性格預測研究,信息時代使得社交媒體成為了數據獲取的主要來源。常見的用于性格預測的方法如提取特征利用機器學習算法進行分類,以及利用自然語言處理技術對文本詞嵌入輸入至神經網絡(如CNN、RNN等)實現性格預測,同時,預訓練語言模型(如Bert)的火熱也給這一領域帶來了新的活力。除文本信息,利用多模態技術結合文本、聲音、圖像等數據進行性格預測的方法也成為了新的研究熱點。
3.1.2 基于MBTI性格量表的性格預測
Myers-Briggs Type Indicator(MBTI)在非科學界非常流行,許多人采用該性格量表來分析自己的性格并在社交媒體中加以分享討論,這使得有關MBTI的自我評估數據在諸如Twitter等社交媒體中輕松獲得。
其中比較有代表性的工作,如Ben Verhoeven等人[14](2016)從Twitter中創建了一個基于MBTI的新的語料庫,適用于荷蘭語、德語等六種語言,他們使用了sklearn中的線性SVC以及邏輯回歸等常用機器學習算法給出了一個baseline,其分析結果同樣對性別的識別較有成效。
Kosuke等人[15](2019)認為人們在社交平臺上的文本化信息和用戶行為(如點贊和分享)對于預測社交媒體用戶的性格有積極的作用,他們發現有很多社交媒體用戶經常瀏覽他人的帖子,卻很少發布自己的信息,這些用戶往往通過用戶行為(點贊和分享)來表達自己的觀點和偏好。因此作者從Twitter中爬取數據構建數據集,基于MBTI的性格模型指標,利用BOW、SVD、DBOW、Co-occurrence等文本分析方法分析用戶行為,從而對其性格進行分類。
在線教育已經成為現代教育體系的一個重要方面,而學生性格的不同會導致在線學習的效果差異明顯。Mohamed等人[16](2015)基于MBTI理論使用了10種數據挖掘分類算法如樸素貝葉斯、隨機森林等對從埃及開羅的德國商學院收集的數據集進行分析,以幫助學生意識到自己的性格特征,從而使他們的學習習慣變得更加有效。
MateJ等人[17](2018)利用Reddit社交媒體構建了一個帶有MBTI標注的大型數據集——MBTI9k,通過特征提取以及三種機器學習算法(SVM、LR、MLP)對性格進行分類,在“感覺和直覺”(N/S)性格維度上的F1值達到了82%,但在“理性和感性”(T/F)的性格維度上只有67%,因此可能需要利用深度學習模型以提高在T/F性格維度上的性能指標。
近年來,電子商務發展迅速,因此為用戶提供更為準確的推薦服務便顯得尤為重要。Chen等人[18](2019)提出了一種基于消費性格本體的用戶模型表示方法,按照消費性格的不同,將用戶分為順應性、保守型、自由型、怪癖型、經濟型五種類型。實驗選取自某電子商務網站服裝類下的500個實際商品資源,分別采用了基于關鍵詞的表示方法、傳統的基于文本的表示方法和基于消費性格本體的表示方法對推薦結果進行統計分析,實驗結果顯示后者在準確度上高于前兩者,推薦的商品與用戶需求更為契合。
3.1.3 小結
在性格預測方面,現如今的性格預測研究,多是以基于社交媒體的開源數據集為主,一般基于大五人格模型和MBTI進行性格預測。研究者將性格理論與社交媒體相結合,通過性格信息可以更好的理解社交媒體用戶的行為,對于個性化推薦、輿情分析、用戶心理預警(如自殺檢測、抑郁檢測、幸福感評估等)有重大研究價值。
3.2 抑郁檢測
抑郁癥是影響全球人類健康的一項重要因素,預防抑郁癥有助于保護人類的健康。早期抑郁癥的發現對于患者至關重要,但由于人們往往對咨詢心理醫生感到反感,所以許多研究工作利用計算性格學的思想,對潛在用戶進行抑郁檢測,有助于在早期發現抑郁癥,從而得到及時的治療。
抑郁檢測是計算性格學中的一項重要任務,它指的是獲取UGC(用戶所生成的信息),如文字、音頻和圖像等,使用自然語言處理等技術,檢測和預測相關用戶的抑郁狀態;將UGC作為輸入,輸出為用戶是否患有抑郁癥的概率值。
3.2.1 基于線下問卷的抑郁檢測
在心理學領域中,早在2006年,Cloninger等人[19]通過一項縱向研究,研究了性格特征在個體易患抑郁癥可能性中的作用;而在社會語言學領域中,Oxman等人[20](1982)指出,語言分析可以將被分為抑郁和偏執兩類。據此,抑郁檢測的研究圍繞著相關抑郁的書面文字而展開。
通過LIWC對書面文本的分析也揭示了有關神經病傾向和精神疾病的預測線索(Gortner和Pennebaker, 2004)[21]。Resnik等人[22](2013)以Rude等[23](2004)收集的文章為材料,該文章是由學生以“大學生活中最深刻的想法和感受”為題創作的文字材料,結合貝克抑郁測量表(Beck等人, 1961)[24]計算的BDI值,利用LR模型分別對LIWC(Pennebaker和King,1999)[25]和LDA(Blei等人,2003)[26]提取的特征,再對兩者結合的特征進行訓練,預測文章的作者是否患有抑郁癥。該研究首次使用計算性格學的方法對文字材料進行檢測,為后來以社交媒體為載體的抑郁檢測研究提供了可能性。
上述的研究為檢測抑郁癥提供了相關思路,但是其存在顯著的局限性,它在樣本選取時,存在著樣本數量少,樣本特征相似的缺陷,這些樣本不一定代表大多數抑郁癥患者。此外,這些研究通常基于問卷等相關形似的調查,依賴于抑郁癥患者相關情緒的回顧性自我報告和有關健康的觀察結果,而這樣的調查通常要持續數月,甚至數年,就需要投入大量人力、物力。總而言之,其存在資源的浪費且受限于時間粒度的弊端,無法及時有效地預測抑郁癥。
3.2.2 基于社交媒體的抑郁檢測
1. 結合書面文字的抑郁檢測
隨著社交媒體的興起,越來越多的人喜歡在社交媒體上分享自己的生活狀態。而對于抑郁癥患者,由于在現實生活中有時會受到他人的歧視與侮辱,使得他們更多的傾向于在社交媒體上分享自己的抑郁狀態和尋求幫助。Moreno等人[27](2011)證明,Facebook上的狀態更新可以用于揭示嚴重抑郁癥發作的癥狀,而Park等人[28](2012)在Twitter的平臺下發現了最初的證據,郁癥患者傾向在社交媒體上發布有關抑郁癥甚至治療的信息。
表3.4 基于社交媒體的抑郁檢測模型
正因如此,可以利用社交媒體中于用戶相關心理活動和社會環境活動的數據流,以一種時間細粒度的方式,檢測相關用戶易患抑郁癥的可能性。但由于相關社交媒體數據集的缺乏,以及僅根據社交媒體的數據無法判斷用戶是否患有抑郁癥,所以此時大多的研究所使用的數據集都是通過將社交媒體動態和面對面訪談或問卷調查相結合構建的。
Munmun等人[29](2013)探討了在社交媒體上進行抑郁檢測的潛力,通過收集Twitter用戶是否患有抑郁癥的數據,再結合他們在社交媒體上的行為與標準用戶的行為的區別(抑郁癥用戶表現為社交活動減少、消極情緒增加、自我關注度高和宗教思想表達增強等),建立特征模型,但此研究同樣受困于缺乏標注的數據集,利用SVM分類器僅得到準確率為74%的結果。 Park等人[30](2013)通過社交媒體(Twitter)檢測用戶是否患有抑郁癥,對Twitter上14名活躍用戶進行半結構化的面對面訪談,對其進行定性分析,以了解抑郁癥用戶和非抑郁癥用戶對社交媒體的感知和行為差異,研究得出以下結論,抑郁癥用戶將社交媒體視為社交意識和情感分享的工具,而非抑郁癥用戶則將社交媒體信息分享的平臺。
上述研究工作將社交媒體動態、問卷信息、訪談信息以及實際心理活動等信息結合,可以獲得不錯的效果,但是由于收集訪談等信息需要投入大量的人力、物力,在一定程度上制約了其發展。
2. 基于社交媒體信息的抑郁檢測
隨著技術的進步,以及受到Coppersmithet等人[31]的啟發,根據內容中是否嚴格存在“我是/我曾是/抑郁癥”的語句結構,可將文章標注為抑郁指向性文章和標準文章,進而實現了直接從社交媒體中獲取標注完整的數據集的目標。
在此方法提出后,大部分研究主要集中在分析公開的社交媒體文本內容,其中一些特征最常用于理解個體的心理狀態,通常是使用著名的LIWC(Pennebaker等人,2001)[32]提取特征,如第一、第二、第三人稱代詞、感知過程相關單詞或正、負情緒詞(Wang等,2017)[33]。在對文本進行情感分析時,常使用諸如OpinionFinder(Wilson等,2005)[34]、SentiStrength(Thelwall等,2010)[35]和ANEW(Bradley和Lang,1999)[36]等工具用于量化文本表達中的感知和情感屬性(Kang等,2016)[37]。此外,表情符號和圖像也被用于檢測社交媒體帖子中的積極和消極情緒(Kang等,2016)[37]。作為內容分析的一部分,為了從用戶生成的內容中提取主題,集成了各種類型的主題建模,常使用的模型如LDA[26]。
在對數據集進行預測時,使用的預測模型大多是采用有監督的機器學習模型進行訓練和預測。其中比較有代表性的方法包括,如Shen等人[38]根據上述的方法構建了標注齊全的抑郁和非抑郁數據集,并提取了六個與抑郁相關的特征組,涵蓋臨床抑郁標準和社交媒體上的在線行為。通過這些功能組,提出了一種多模態抑郁詞典方法,并結合實驗證明了該方法的有效性,以實現Twitter上抑郁用戶的檢測。Hiraga[39]探討了書面語言中的語言特征是否可以通過使用監督的機器學習方法來幫助預測作者是否患有抑郁癥,其研究以一般主題的日語博客作為數據集,通過Character n-grams和Token n-grams提取文本特征,使用scikit-learn (Pedregosa等人,2011)[40]中的Multinomia lNaiveBayes(NB)分類器, Linear Support Vector Machines(SVM)分類器和Logistic Regression(LR)分類器對博客進行分類。實驗表明,在作者級別分類任務,準確率可達86.4%;而對于文本級別的分類任務,準確率最高為75.5%。但由于實驗數據規模較小,無法確定是否在大規模數據集上依然可以有效。
區別于傳統的機器學習方法,Yates等人[41]使用神經網絡模型進行抑郁檢測并描述了自殘與抑郁癥的緊密關系,根據Reddit自我報告的抑郁癥診斷(RSDD)構建了用于識別用戶的數據集,與之前的提取特定性的特征和使用有監督的機器學習模型不同,研究從文本內容出發,提出改善后的神經網絡CNN(Kalchbrenner等人,2014)[42]模型,在F1上獲得優秀的表現。但由于Reddit平臺用戶的匿名特性,無法確定數據是否具有真實性;另外,該研究忽略了未進行自我報告的抑郁癥用戶,而那些抑郁癥用戶的隱藏式推文依然還需進一步研究。
(gap)在大量工作的投入后,在社交媒體上進行抑郁檢測的研究也陷入了瓶頸,急需在方法上取得進展。基本研究方法大多是在小時間窗口中進行收集數據和模型預測的,忽略了對離散的基本情緒的利用。Chen等人[43]第一次以情緒特征和時間序列對社交媒體上的用戶進行抑郁檢測,其以Twitter的帖子作為數據集,根據八種基礎情緒提取情緒特征,再利用時間序列測量方法對情緒測量結果進行分析,得出一組時間特征,分別以情緒特征和情緒特征與時間特征結合的方法,進行抑郁檢測。經實驗得出,僅使用情緒特征提取的預測結果的準確率為87.27%高于先前研究的結果,另外結合時間序列特征的研究結果,隨著時間的推移,準確率可達到89.77%。實驗證明,情緒特征可以揭示個人的心理狀態,而隨著時間的推移,情緒的變化會帶來更多的信息,其有助于檢測抑郁癥。雖然對于情緒數據的判斷需要專業培訓和與抑郁心理深度相關的數據,但此方法為抑郁檢測帶來了新的思考角度。
(多模態) 不同于先前單一文本材料作為輸入的研究,Samareh等人[44]提出通過多模態特征工程與融合的方法預測抑郁癥的嚴重程度,在AVEC 2017(Ringeval等人.2017)[45]數據集上,證明了該方法具有良好的性能。AVEC 2017數據集是由音頻、視頻和文本信息組成,通過分別提取音頻、視頻和文本信息的特征,利用隨機森林分類模型得到每個特征的分數,再基于置信度的決策機融合特征得到最終的預測結果。相似的,Gui等人[46]選擇了從文本信息和視覺方面的信息進行研究,利用強化學習的方法來篩選相關推文,并有效地融合了文本和視覺的特征,實驗證明此方法在實際情況中性能強大且穩定。
(gap:跨語言)另外,盡管抑郁檢測已經在Twitter和Facebook等平臺上被證明了有效性,但是由于文化的差異,無法直接將一些研究方法應用于其他語言的社交媒體,比如使用中文作為基本語言的微博,其可能由于缺少已標注的數據集而效果不佳。Hen等人[47]提出了一種具有特征自適應變換的跨域深層神經網絡模型,以大量的Twitter數據作為源域,研究了以特定目標域(如微博)的抑郁檢測,經過實驗得出,該方法有效可以較好的在跨領域語言中檢測抑郁。雖然在部分數據集上可以取得不錯的結果,但是仍缺乏與線下的實際情況結合,無法直接應用于臨床診斷。
發展至今,基于社交媒體信息的抑郁檢測取得了相當大的成果,隨著模型準確率的不斷提高,則會更加準確的預測用戶是否患有抑郁癥,并能夠早發現、早治療,從而有助于全人類的健康。
3.2.3 總結
社交媒體上對抑郁癥的檢測取得了長足進步,隨著準確率的提高,其可以用來預測抑郁癥,使患者可以得到早期治療。以下提出相關的幾個未來研究方向:為更好的檢測社交媒體的抑郁用戶,可尋找用戶所創作的文字信息、圖片和聲音等之間的邏輯關系,為抑郁檢測提供多維度的依據,以在實際情況中更具實用性;隨著抑郁檢測的準確性的不斷提高,如何將抑郁檢測應用于臨床檢測也成為了未來的一個重大研究課題,比如通過用戶創造的信息,結合抑郁癥臨床癥狀,以判斷抑郁癥的嚴重等級,并進行及時干預。
3.3 自殺檢測
根據美國疾病控制與預防中心(CDC)的最新數據,自殺是10-34歲之間的第二大死亡原因和35-64歲之間的第四大死亡原因,且自殺率呈上升趨勢。據統計,中國每年有28.7萬人死于自殺,200萬人自殺未遂,因此造成的直接和間接經濟、社會、心理損失不可估量,成為了一個嚴重的公共衛生問題。傳統的自殺風險評估研究主要采用心理測驗、問卷等分析方法,但實際使用時,以上方法仍然具有一定的局限性。隨著近年來越來越多的社交網絡平臺讓人們有更多機會在虛擬社區中吐露自己的感受和觀點,那么通過社交網絡也就能主動尋找有潛在自殺傾向的個體,并對他們進行分析和預警。目前基于社交媒體的自殺風險評估研究常采用四標簽(無風險,低風險,中度風險和高風險)分類方案對自殺用戶進行分類,通過用戶在社交媒體上的表達和行為信息預測其自殺風險。下面進行詳細介紹。
3.3.1 基于問卷的自殺風險檢測
傳統的心理學研究人員已經開發了一些獲取自殺風險的心理學測量方法,如Bagge等[48]的自殺概率量表、Fu等[49]的成人自殺意念問卷、Harris等[50]的自殺影響行為認知量表等,各個量表也有各自的適用群體范圍。這些心理學量表是專業和有效的,在實際使用過程中也展現出了較好的效果,有一定的參考價值。Sueki等[51]做了關于自殺相關Twitter和自殺行為之間的相關性研究,參與者回答了一份自我管理的在線問卷,其中包含關于Twitter使用、自殺行為、抑郁焦慮等問題,調查結果顯示,Twitter文本有助于識別有自殺傾向的青年網民。
但基于問卷的自殺風險檢測具有一定的局限性,即量表的研制可能只是針對某些影響自殺的因素或是某些特定群體,而且要求受訪者填寫評估表或是參加面談,這樣對那些很少尋求專業幫助的潛在自殺者不能起到很好的識別作用。同時耗費時間、人力較大,難以勝任大規模的實時自殺檢測任務。綜上所述,心理學量表法固然有其專業、理論性好的優勢,但仍需要更進一步的研究以提高自殺檢測的準確率與效率,即引入計算機技術,通過更大規模的數據及計算量實現更為普適、實用的檢測方法。
3.3.2 基于官方統計數據的自殺風險檢測
本小節中的官方統計數據指的是官方機構統計記錄并發布的數據,但與心理學問卷不同的是,這里的統計數據一般數據量較大,數據維度較多,同時也包括很多與自殺無關的維度,所以在數據處理方面較為依賴計算機技術,也更為貼合大數據的概念。Walsh等[52](2017)人在進行自殺意念檢測研究時,使用了匿名電子健康檔案(EHR)數據集,其數據集大小大于50萬,并采用了隨機森林(RF)方法進行自殺風險的二分類,最終F1分數達到86%,召回率達到95%。Bhat等[53](2017)在一項關于預測青少年自殺的研究中,應用深度神經網絡來預測自殺想法,同樣使用匿名電子健康檔案(EHR)數據集,最終模型獲得了70%的真陽性和98.2%的真陰性。Amini等[54](2016)采用來自伊朗的自殺數據集,利用支持向量機(SVM)、邏輯回歸(LR)、人工神經網絡(ANN)等傳統機器學習方法來評估自殺風險,并發現性別、年齡、工作等是影響自殺意念的重要因素。
基于官方統計數據的自殺風險預測可以探究更多影響自殺信念的因素,然而其數據集構建較為困難,且難以實際應用于在線自殺檢測任務。而隨著社交媒體的廣泛使用,其包含的大量無監督語料、社交網絡特征等進一步提供了更為全面的信息以及更為便捷的數據獲取方式,給自殺檢測研究指出了一個新的方向。
3.3.3 基于社交媒體的自殺風險檢測
近年來基于社交媒體研究的數據集主要來源于Reddit、Facebook、微博等社區平臺,而相關的研究則主要集中在識別自殺信息的真實性以及識別社交媒體中的自殺信息等方面。前者主要研究在給定一些自殺相關的數據集后,如何判定其真實性,如Reddit的自殺子社區中的發言;后者主要研究在用戶發布的日常推文(即日常發布的文本)中識別高自殺風險的文本及用戶。下面逐一進行介紹。
1. 識別自殺信息的真實性
此處的自殺信息多指用戶發布的自殺文本。識別自殺信息任務的文本數據集一般較小,具有一定的分類難度。Pestian等[55]利用機器學習技術創建了一個自殺文本分類器,在區分虛假的在線自殺文本和真實的自殺文本方面,它比人類心理學家表現得更好。Jones等[56]的工作重點在于區分真實的和偽造的自殺文本,使用了有監督分類模型和一組語言特征來進行區分,并達到了82%的準確率。Burnap等[57]進行了自殺檢測分類,用于區分自殺相關主題,比如是真實的自殺事件還是僅是提及了自殺。
2. 識別社交媒體中的自殺信息
社交媒體中的自殺信息識別研究主要集中在自殺文本識別上。Li等人[58](2013)的自殺風險檢測研究將文本情感分析技術應用于中文網絡論壇中的用戶帖子和帖子評論,以識別自殺文本。Huang等人[59](2015)基于微博數據,基于詞嵌入和心理學標準,使用主題模型識別自殺信念,并構建了一個自殺信念檢測的原型系統,用以實時監控自殺文本。Gamback等[60]開發了同時使用n-grams特征和word2vec的卷積神經網絡,大大提高了分類性能。Lei Cao等[61]研究了樹洞在微博自殺風險檢測中的應用,采用兩層注意力機制從個人博客流中捕捉變化點。并基于詞嵌入和注意力機制,提出了一個比設計良好的基準方法更有效的自殺風險檢測模型,準確率達到了91%。
文本、圖等數據的特征抽取也得到了本領域研究人員的關注。Jashinsky等[62]使用支持向量機(SVM)預測了某人在一段時間內的自殺風險水平,使用每條推文的詞語頻率-逆文檔頻率(TF-IDF)、字數、唯一字數、平均字數以及每條推文的平均字符數作為輸入特征。De Choudhury等[63]確定了語言,詞匯和網絡特征,用這些描述了患有心理健康疾病患者的特征,用于預測自殺風險,分析Reddit上自我報告帖子的內容,得到有關用戶的心理健康狀況,并利用傾向得分匹配測量了用戶將來分享自殺想法的可能性。Xu等[64]基于中文微博數據,抽取了字典特征及語言特征,并驗證了其對于基于n-gram特征的模型性能有所提高。
一些研究人員也通過引入領域知識、增加數據特征等方式在原有數據集基礎上構建新的數據集。Manas Gaur等[65]結合了特定領域知識來預測個人自殺風險的嚴重性,使用醫學知識和自殺本體論來開發自殺風險嚴重性詞典,同時創建了一個Twitter數據集,并將現有的四標簽分類方案擴充到五標簽分類。Rohan Mishra等[66]利用文本特征、社交圖的嵌入特征等,探討了用戶在社交媒體上的行為信息的使用。并開發了一個人工注釋的Twitter中自殺檢測數據集,采用上述特征進行模型訓練,結果驗證了所提出的SNAP-BATNET模型在自殺檢測中的優勢。
除了對自殺文本的分類識別之外,有研究人員也試圖擴大自殺檢測的研究范圍,如探究自殺誘因等。Du等人[67]使用深度學習方法來檢測導致自殺的精神壓力源,使用卷積神經網絡(CNN)構建了識別自殺推文的二分類器,一旦檢測到自殺性推文,他們就會使用循環神經網絡(RNN)進行命名實體識別(NER),以標記歸類為自殺的推文中的精神壓力源,同時實現了文本的識別及因果的推理。
綜上,對社交媒體的自殺檢測研究已經取得了一定成果,且由于數據獲取難度低、文本分析技術較為成熟,故未來的研究前景仍然廣闊。然而基于社交媒體的文本等數據篩選難度較大、圖特征采集難度較大、數據標注難度大等,且理論基礎不足,目前多用于輔助判斷自殺風險,故仍需完善數據集及研究方法,不斷提高識別準確率。
3.3.4 小結
目前的自殺檢測研究主要集中在利用用戶在社交媒體上發布的文字等數據對用戶的自殺風險進行分類,進一步包括對自殺誘因的識別和遺書真偽的判斷。方法一般是提取文本、圖形等數據的特征,并用機器學習模型進行分類。隨著深度學習的快速發展,各種端到端的自殺風險識別模型和一些在線自殺風險檢測模型應運而生。可以預見,隨著對自殺檢測研究的不斷深入,可以更準確地識別有自殺傾向的人,及時進行心理疏導,預防自殺行為。
此外,自殺檢測的數據來源和形式也在不斷多樣化。社交網絡數據逐漸引起研究人員的關注。自殺念頭容易在社交網絡中傳播,因此,研究自殺念頭的傳播方式和過程,可以有效提高自殺檢測的準確性,甚至遏制自殺念頭的傳播。一種常見的自殺原因和前兆是抑郁癥的出現,未來可以結合抑郁癥檢測來研究抑郁癥與自殺的關系,其有助于提高自殺檢測的準確性。
3.4幸福感評估
隨著社會越來越重視人們的心理健康,幸福感逐漸成為人們研究的熱門方向,尤其現在像抑郁、自殺現象逐年升高,對于這類負面情緒的消除有著重要的研究價值和社會意義。因此必須要了解什么是幸福感,如何去獲得幸福感。計算性格學作用于幸福感研究就是通過自然語言處理等技術挖掘出文本中與幸福感相關的信息,比如幸福感的來源,幸福感的強弱,幸福感預測等等。幸福感評估想要解決如何去衡量一個人感到幸福的程度,對幸福感這樣一個抽象的概念進行量化。研究者從被測量者的相關信息中進行建模,最后給出用戶幸福感的程度。
幸福感屬于心理學范疇,幸福感主要是指人們對其生活質量所做的情感性和認知性的整體評價,具有主觀性、穩定性和整體性三個特點[68]。幸福感的代表學者Diener[68]提出幸福感由情感維度和認知維度組成,即擁有較多的積極情感和較少的消極情感,以及對生活的滿意感。國內外對幸福感的研究已經較為成熟,以Diener為代表的學者對幸福感的內涵、維度和測量方法基本達成共識。
在幸福感的研究中, 性格是預測幸福感最有力和最穩定的指標之一[69],性格從本質上表現了人的特征。在Diener提出的交互模型中,認為性格影響著人們處事的行為和態度,增加經歷某種情境的可能性,不同的情境又引起幸福感增加或減少,這也是計算性格學在心理學方面的一個理論依據。
對幸福感評估的研究早期主要以量表為主,后期轉向了文本,下面按照這兩個階段對幸福感評估的相關研究進行闡述:
3.4.1 以量表為主的早期研究
幸福感的研究大致從 20世紀 50年代在美國興起。從其發展背景來看,一是源于人們生活質量的不斷提高,二是積極心理學、健康心理學的崛起對人類自身生存與發展的日益關注。20世紀70年代以來,研究者將這一課題的研究從哲學層面上升到科學層面,實證性研究不斷增多。在這一過程中,幸福感的解釋理論直接影響了人們的研究方向[70]。從理論出發,研究重點轉向測量幸福感,探討提高人們幸福感的方法。
最早測量幸福感的工具是Bradburn在1963年編制的情感平衡量表(Affect Balance Scale,ABS)。該量表共10個題目,包含積極情感和消極情感兩個維度。主試根據這兩個維度的總得分推測被測者的近期情感狀態,進一步推測其主觀幸福感水平。有研究者提出主觀幸福感是個體長期穩定而非暫時的情感狀態,ABS評價的是個體暫時的情感狀態,因此對以ABS 的結果來推測主觀幸福感被提出質疑[71]。
在這之后出現了許多幸福感測量工具,如D-T量表(Delighted-Terrible Scale),紐芬蘭紀念大學幸福感量表(the Memorial University of Newfoundland Scale of Happiness,MUNSH),生活滿意度量表(the Satisfaction With Life Scale,SWLS)等。Liu等[72]在其論文《幸福感測量指標體系的評價與展望》中詳細對比了現有國內外幸福感測量工具中的結構維度,結果發現僅有24%使用現有理論開發測量工具。以理論為導向的指標體系構建往往可以使測驗結果更為客觀、公平、準確,但未來還應加強幸福感理論構建。心理測量特性分析表明,各幸福感的測量信效度水平不一,只有不到一半的測量工具報告了注重測信度,這限制了相關工具的應用。
由于對幸福感的研究才剛剛起步,所以這一時期人們主要是采用量表的方式對幸福感測量評估,其效果與專業的心理學理論緊密相關。但是量表這種方式太過依賴于用戶,收集統計工作也比較繁重。
3.4.2 以文本為主的近期研究
在如今計算機尤其人工智能飛速發展的時期,問卷調查和社交媒體因為其與用戶密切相關的特性,也逐漸被用來對幸福感進行測量評估。問卷調查并不僅是直接使用上文中提到的幸福感測量工具,采集的數據多是與幸福感相關的描述。比如2018年Asai[73]等發布的公開幸福感數據集HappyDB3,它的來源就是對某一工廠的工人進行問卷調查,記錄下他們在某一時間段內感到幸福的時刻,共收集到100000個幸福瞬間。社交媒體則是從如Twitter,Flickr,Blog等社交媒體平臺中搜集到幸福感相關文本數據。出于社交媒體對于用戶的隱私考慮,來源于社交媒體的數據集一般都是自行構建且不會公開。但也有少數公開的數據集,如Jiayin Qi[74] 等公布的搜集于中國草根博客的 Ren-CECps-SWB 2.0 中文數據集。
在方法上,研究者多會用到情感資源,通過情感詞典等來輔助評估。下表總結了近幾年的相關工作:
首先,從數據來源上看,所列舉的文獻都是從社交媒體自行構建的數據集,一方面,社交媒體是由用戶實時產生數據,與用戶直接相關而且數據量龐大,并且相比而言比較容易獲得,有利于研究者進行分析;但另一方面,社交媒體平臺都會注重用戶的隱私問題,所以采集到的數據不易公開,所以需要自行構建數據集。
方法上所有列舉文獻都在采用情感分析作為依據。因為幸福感也是一種積極的情感,所以可以借助一些情感詞典來進行情感分類,外部資源通常是一些公開的情感詞典,通過情感上的積極與否來給出一個評估。或者是利用數據來源里的額外信息,比如博客中會提供給作者表達情感的標簽,這些都可以作為研究者分析的重要依據。
至于最后評估的指標,可以看到隨著時間的推移,有著不小的變化。最初僅是和情感詞典進行簡單匹配,得到一個大致的估計,但幸福感是一種相對復雜的情感,簡單的詞典匹配不足以深入的描述它,需要更加科學的指標來進行評估,到后來利用一些科學指標方法,如PANAS,PWBS等,到最終構建面向該任務的評級指標,可以看出對幸福感的評估在趨于科學化,合理化。
幸福感評估的研究從量表開始,然而量表需要專業人士的設計,并且采集數據過程繁瑣。隨著互聯網興起,文本資源被研究者利用起來,通過自然語言處理等技術,同樣能夠對用戶的幸福感進行評估。計算機科學正在飛速發展中,數據也在井噴式的增加,將計算機科學作用在幸福感數據上,在將來會挖掘出更多的信息,對幸福感的研究提供更多幫助。
3.4.3 小結
幸福感評價量表要求耗時的專業人員設計,數據收集過程也很繁瑣,通過計算機科學可以大大提高其效率。未來,對幸福的研究會更加深入細致,數據來源將趨于多樣化,不僅僅是問卷和社交媒體,還有可穿戴設備等更豐富的數據可用于從更多維度研究幸福感。同時評價指標將更傾向于與任務相結合,將比現有的心理指標更加多樣化、合理化、更加準確地描述幸福程度,并為其他與幸福度量及分析相關任務提供指標。
4. 技術評測及其資源
計算機性格學研究任務中,數據集以及資源的存在是必不可少的,隨著社交媒體的普及,以及收集數據工具的增多,使得構建的資源越來越多,以下提出了在性格檢測、抑郁檢測、自殺檢測和幸福感評估中的技術評測及其資源。
4.1性格預測的相關技術評測及其資源
(1)(MBTI) Myers-Briggs Personality Type Dataset
Kaggle上一個開源的基于MBTI指標的競賽,該項目的目標是預測一個人的MBTI性格類型。給出的數據來自用戶社交媒體帖子的Personality Cafe網站論壇,包含8600多行信息,每一行都是一個人的數據,第一列為MBTI指標(4個字母),第二列為該用戶最近發布的50條文本信息。格式如下圖所示(僅列出前5條數據):
參賽者需要根據MBTI的四個維度,即外向和內向(E/I)、感覺和直覺(N/S)、理性和感性(T/F)、主觀和客觀(J/P),分別預測這四種類別(每種類別只有兩個分類),最后將預測的四種類別組合在一起,即是該用戶的MBTI性格類型。
(2)MyPersonality
MyPersonality是一個Facebook應用程序,允許其用戶通過填寫個性問卷來參與心理研究。它還為他們提供有關分數的反饋。它由David Stillwell于2007年創建。2018年4月,由于維護數據集、審查項目、響應查詢等事務繁重以及遵守各種法規(涉及用戶隱私問題)等問題,不再共享數據。
(3)Twisty
Ben等人[14]基于Twitter構建的一個使用MBTI量表的語料庫,適用于荷蘭語、德語等六種語言。它標注了性別、性格等標簽,共有18168條數據。
4.2 抑郁檢測的相關技術評測及其資源
(1)基于Twitter平臺的抑郁檢測任務數據集
不同于通過費時費力的訪談和問卷調查獲取數據集,Shen等人[38]受到Coppersmithet等(2014)[31]的啟發,收集了Twitter上數據,并通過相應的規則,自動地來判定文章是否為抑郁指示性文章;該數據集由抑郁數據集、非抑郁數據集和抑郁傾向性數據集組成,抑郁數據集由在一個月內收集到的相關抑郁性文章(292564條推文)和相關的1402名抑郁用戶組成;非抑郁數據集是由Twitter上的標準活躍用戶和其所發的推文所組成的;由于抑郁數據集太過稀少,因此在一定程度上放寬了在選擇抑郁數據時的標準,若存在“沮喪”等表達,則選為傾向性抑郁數據。該數據集的具體分布如下:
該數據集可作為抑郁檢測任務的原始數據集,在該數據集上的準確率能達到85%左右。
(2)基于Reddit平臺的抑郁檢測任務RSDD數據集
Yates等人(2017)[41]從公共可用的Reddit數據集上收集到用戶自我診斷的抑郁檢測(RSDD)數據集:其中,收集到的診斷報告被三個非專業人士判斷是否患有抑郁癥,即為了防止數據集出現“如果我是抑郁癥”等假性抑郁癥材料。但是由于Reddit平臺的特性,RSDD數據集可能不具有代表性,其收集于那些自我診斷為抑郁癥的用戶,而忽略了那些未進行自我診斷的抑郁癥用戶,另外,由于用戶的匿名,無法證實這些自我診斷為抑郁癥的報告是否屬實。
該數據集可用于抑郁檢測任務,在該數據集上的準確率能達到59%。
4.3 自殺檢測的相關評測及其資源
自殺評測CLPsych 2019 Shared Task: Predicting the Degree of Suicide Risk in Reddit Posts
簡介:2019年計算語言學和臨床心理學研討會(CLPsych’19)的Shared Task是根據社交媒體發布的信息評估用戶自殺風險,數據來源于Reddit帖子,三個子任務都是四分類任務,標簽為無、低、中等以及高自殺風險。數據分為兩部分,一部分是來源于Reddit自殺版塊的帖子,另一部分則來源于非自殺版塊的帖子。第一個任務只使用自殺版塊的帖子,數據量少;第二個任務使用了自殺和非自殺版塊的帖子;第三個任務只使用用戶的日常帖子(非自殺版塊)。具體數據及結果如下表。
4.4 幸福感評估的相關評測及其資源
評測任務來自于“AffCon2019: The 2nd AAAI Workshopon Affective Content Analysis”,它是AAAI2019中的一個workshop。評測任務使用的數據集是從數據集HappyDB中人工標記的10506條數據和未標記72324條數據。其中每條數據包括某人描述的一個幸福時刻的文本,以及主人公的回憶時間和相關標簽。主辦方人工標注了兩個新的標簽:agent和social。agent描述這一個幸福時刻是否作者在控制之中,social描述這一刻是否涉及作者以外的其他人,用0和1表示。評測一共包含兩個任務:
任務一的題目是“幸福的要素是什么”。它是一個半監督學習任務:根據已標記和未標記的訓練數據,預測測試集中快樂時刻的agent和social標記。評價結果采用了準確度和F1值,最終的評測結果,這里列舉了排名前三名的隊伍,并且給出了每個隊伍的模型和分類結果,詳細內容見下表:
任務二的題目是“我們怎樣才能塑造幸福”。它是一個無監督任務,為測試集中的快樂時刻提出新的特征和見解(不限主題),例如情感、參與者和內容。任務二作為一個開放性任務,沒有統一的評價標準,參賽團隊都是在任務一的基礎上進行了進一步的分析和可視化,比如探索agent和social標簽之間的依賴性。
5. 可解釋性與道德問題
隨著計算性格研究開始使用社交媒體的文本和其他信息,機器學習和深度學習算法的應用越來越廣泛。然而,與心理量表相比,深度學習算法的適用性雖然更好,但也存在可解釋性和倫理問題。首先,作為一種黑盒算法,深度學習算法沒有很好的心理學理論支持,其結果難以解釋。這阻礙了相關算法的發展,也讓模型難以深入理解什么是性格。然后,也使得模型的結果更加不可控,這導致很難避免一些潛在的風險(比如模型是否對不同的群體有偏見)。其次,由于深度學習算法需要大量數據,一直面臨著數據隱私的問題[83]。如何保證用戶在獲取和使用數據中的隱私也是非常有爭議的問題。
一些研究工作已經對這些問題給出了解答,如Muller 等人[84]提出了十個命令作為參考。然而,計算性格研究中的模型可解釋性和倫理問題仍然亟待解決,是一個值得研究的領域。
主要的比較貼近的文獻,關鍵性文獻
6. 結論
In this paper, we review recent advances and available data resources in computational personality in four aspects: personality prediction, depression detection, suicide detection, and happiness assessment. We have also conducted an indepth discussion on related fields. In particular, we construct the overall research framework of computational personality, which provides an overview of the research from resource to application. Furthermore, we discuss the ethic issue and interpretability of the algorithms. We hope that our work will encourage further interdisciplinary research on computational personality and facilitate progress in this area.
本文中從四個方面回顧了計算性格學的最新進展和可用的數據資源:人格預測、抑郁檢測、自殺檢測和幸福感評估。同時,還就相關領域進行了深入探討,構建了計算性格學的整體研究框架,提供了從資源到應用的研究概述。此外,討論了算法的倫理問題和可解釋性。希望這一工作將推進對計算性格學的進一步研究,并促進該領域的不斷進展。
參考文獻
參考文獻
[1] Funder D C. On the accuracy of personality judgment:a realistic approach[J]. Psychological Review,1995,102(4):652.
[2] C. G. DeYoung. 2010. Toward a theory of the big five. Psychological Inquiry 21(2010), 26–33.
[3] Funder D C. Personality[J]. Annual Review of Psychology, 2001,52(1):197-221.
[4] Pianesi F.Searching for personality [social sciences] [J]. IEEE Signal Processing Magazine, 2013,30(1):146-158.
[5] Shlomo Argamon, Sushant Dhawle , Moshe Koppel , James W. Pennebaker, Lexical predictors of personality type. In Proceedings of the 2005 Joint Annual Meeting of the Interface and the Classification Society of North America.
[6] Zheng Huizhong, Zuo Wanli. Multi-label social network user personality prediction based on information gain and semantic features. Journal of Jilin University. Vol. 54 No. 3 May, 2016.
[7] LiuPing, Cui Zongyi, Zhou Weixiang, Zhang Yangsen. Research on the characterprediction of Weibo users based on behavior information. Journal of Beijing University of Information Science and Technology. Vol. 34 No.3 Jun. 2019.
[8] Michal Kosinski, David Stillwell, and Thore Graepel. 2013. Private traits andattributes are pre- dictable from digital records of human behavior.Proceedings of the National Academy of Sciences, 110(15):5802–5805.
[9] Jennifer Golbeck, Cristina Robles, Karen Turner. Predicting personality with socialmedia. [C]//CHI’11,2011.
[10] Fabio Celli, Elia Bruni, Bruno Lepri. Automatic Personality and Interaction Style Recognition from Facebook Profile Pictures. MM '14: Proceedings of the 22nd ACM international conference on Multimedia. November 2014 Pages 1101–1104.
[11] Marcin Skowron, Marko Tkalcic, Bruce Ferwerda, Markus Schedl: Fusing Social Media Cues: Personality Prediction from Twitter and Instagram. WWW (Companion Volume)2016: 107-108.
[12] Onno Kampman, Elham J. Barezi, Dario Bertero, Pascale Fung: Investigating Audio,Video, and Text Fusion Methods for End-to-End Automatic Personality Prediction.ACL (2) 2018: 606-611.
[13] Süleyman Aslan, U?ur Güdükbay. Multimodal Video-based Apparent Personality Recognition Using Long Short-Term Memory and Convolutional Neural Networks.Computer Vision and Pattern Recognition. (cs.CV)
[14] Ben Verhoeven, Walter Daelemans, Barbara Plank. TWISTY: a Multilingual Twitter Stylometry Corpus for Gender and Personality Profiling. 2016.repository. uantwerpen.be.
[15] Kosuke Yamada, Ryohei Sasano, Koichi Takeda: Incorporating Textual Information on UserBehavior for Personality Prediction. ACL (2) 2019: 177-182.
[16] Mohamed Soliman Halawa, Mohamed Elemam Shehab, Essam M. Ramzy Hamed. Predicting Student Personality Based on a Data Driven Model from Student Behavior on LMS and Social Networks. 2015 IEEE.
[17] Matej Gjurkovic′, Jan ?najder. Reddit: A Gold Mine for Personality Prediction. Proceedings of the Second Workshop on Computational Modeling of People’s Opinions, Personality, and Emotions in Social Media, pages 87–97.
[18] ChenXue, Huang Qi, Li Yuxuan, Zheng Shuya, Zhang Ge. Research on User Model Basedon Consumer Character Ontology. Vol. 34, No.3. Jun. 2019.
[19] Cloninger C R, Svrakic D M, Przybeck T R. Can personality assessment predict future depression? A twelve-month follow-up of 631 subjects[J]. Journal ofaffective disorders, 2006, 92(1): 35-44.
[20] Oxman TE, Rosenberg S D, Tucker G J. The language of paranoia[J]. The American journalof psychiatry, 1982.
[21] Rude S, Gortner E M, Pennebaker J. Language use of depressed and depression-vulnerable college students[J]. Cognition & Emotion, 2004, 18(8): 1121-1133.
[22] Resnik P, Garron A, Resnik R. Using topic modeling to improve prediction ofneuroticism and depression in college students[C]//Proceedings of the 2013 conference on empirical methods in natural language processing. 2013:1348-1353.
[23] Rude S,Gortner E M, Pennebaker J. Language use of depressed and depression-vulnerable college students[J]. Cognition & Emotion, 2004, 18(8): 1121-1133.
[24] Beck AT, Ward C H, Mendelson M, et al. An inventory for measuring depression[J]. Archives of general psychiatry, 1961, 4(6): 561-571.
[25] Pennebaker J W, King L A. Linguistic styles: Language use as an individual difference[J]. Journal of personality and social psychology, 1999, 77(6): 1296.
[26] Blei DM, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of machine Learning research, 2003, 3(Jan): 993-1022.
[27] Moreno M A, Jelenchick L A, Egan K G, et al. Feeling bad on Facebook: Depression disclosures by college students on a social networking site[J]. Depression andanxiety, 2011, 28(6): 447-455.
[28] Park M,Cha C, Cha M. Depressive moods of users portrayed in Twitter[C]//Proceedings of the ACM SIGKDD Workshop on healthcare informatics (HI-KDD). 2012, 2012: 1-8.
[29] De Choudhury M, Gamon M, Counts S, et al. Predicting depression via socialmedia[C]//Seventh international AAAI conference on weblogs and social media.2013.
[30] Park M, McDonald D W, Cha M. Perception differences between the depressed andnon-depressed users in twitter[C]//Seventh International AAAI Conference onWeblogs and Social Media. 2013.
[31] Malmasi S, Zampieri M, Dras M. Predicting post severity in mental health forums[C]//Proceedings of the Third Workshop on Computational Linguistics and Clinical Psychology. 2016: 133-137.
[32] Pennebaker J W, Francis M E, Booth R J. Linguistic inquiry and word count: LIWC 2001[J]. Mahway: Lawrence Erlbaum Associates, 2001, 71(2001): 2001.
[33] Wang T,Brede M, Ianni A, et al. Detecting and characterizing eating-disorder communities on social media[C]//Proceedings of the Tenth ACM International Conference on Web Search and Data Mining. 2017: 91-100.
[34] WilsonT, Hoffmann P, Somasundaran S, et al. OpinionFinder: A system for subjectivity analysis[C]//Proceedings of HLT/EMNLP 2005 Interactive Demonstrations. 2005:34-35.
[35] Thelwall M, Buckley K, Paltoglou G, et al. Sentiment strength detection inshort informal text[J]. Journal of the American society for information scienceand technology, 2010, 61(12): 2544-2558.
[36] Bradley M M, Lang P J. Affective norms for English words (ANEW): Instruction manual andaffective ratings[R]. Technical report C-1, the center for research in psychophysiology, University of Florida, 1999.
[37] Kang K, Yoon C, Kim E Y. Identifying depressive users in Twitter using multimodal analysis[C]//2016 International Conference on Big Data and Smart Computing (BigComp).IEEE, 2016: 231-238.
[38] Shen G,Jia J, Nie L, et al. Depression Detection via Harvesting Social Media: A Multimodal Dictionary Learning Solution[C]//IJCAI. 2017: 3838-3844.
[39] Hiraga M. Predicting depression for japanese blog text[C]//Proceedings of ACL 2017,Student Research Workshop. 2017: 107-113.
[40] Pedregosa F, Varoquaux G, Gramfort A, et al. Scikit-learn: Machine learning in Python[J]. Journal of machine learning research, 2011, 12(Oct): 2825-2830.
[41] Yates A, Cohan A, Goharian N. Depression and self-harm risk assessment in onlineforums[J]. arXiv preprint arXiv:1709.01848, 2017.
[42]Kalchbrenner N, Grefenstette E, Blunsom P. A convolutional neural network formodelling sentences[J]. arXiv preprint arXiv:1404.2188, 2014.
[43] Chen X, Sykora M D, Jackson T W, et al. What about mood swings: identifying depressionon twitter with temporal measures of emotions[C]//Companion Proceedings of the The Web Conference 2018. 2018: 1653-1660.
[44] Samareh A, Jin Y, Wang Z, et al. Predicting depression severity by multi-modal feature engineering and fusion[C]//Thirty-Second AAAI Conference on ArtificialIntelligence. 2018.
[45] Ringeval F, Schuller B, Valstar M, et al. Avec 2017: Real-life depression, andaffect recognition workshop and challenge[C]//Proceedings of the 7th Annual Workshop on Audio/Visual Emotion Challenge. 2017: 3-9.
[46] Gui T, Zhu L, Zhang Q, et al. Cooperative Multimodal Approach to Depression Detectionin Twitter[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2019, 33: 110-117.
[47] Shen T,Jia J, Shen G, et al. Cross-domain depression detection via harvesting socialmedia[C]. International Joint Conferences on Artificial Intelligence, 2018.
[48] Courtney Bagge and Augustine Osman. 1998. The suicide probability scale: Normsand factor structure. Psychological reports, 83(2):637–638.
[49] King-wa Fu, Ka Y Liu, and Paul SF Yip. 2007. Predictive validity of the chinese versionof the adult suicidal ideation questionnaire: Psychometric properties and itsshort version. Psychological Assessment, 19(4):422.
[50] Keith M Harris, Jia-Jia Syu, Owen D Lello, YL EileenChew, Christopher H Willcox, and Roger HM Ho.2015. The abcs of suicide risk assessment: Applying a tripartiteapproach to individual evaluations. PLoS One, 10(6):e0127442.
[51] Hajime Sueki.2015. The association of suicide-related Twitter use with suicidal behaviour: a cross-sectional study of young internet users in Japan. Journal ofaffective disorders 170 (2015), 155–160.
[52] Colin G Walsh, Jessica D Ribeiro, and Joseph C Franklin. 2017. Predicting risk ofsuicide attempts over time through machine learning. Clinical Psychological Science 5, 3 (2017), 457–469.
[53] HarishS Bhat and Sidra J Goldman-Mellor. 2017. Predicting Adolescent Suicide Attempts with Neural Networks. arXiv preprint arXiv:1711.10057(2017).
[54] Payam Amini, Hasan Ahmadinia, Jalal Poorolajal, and Mohammad Moqaddasi Amiri. 2016. Evaluating the high risk groups for suicide: A comparison of logistic regression, support vector machine, decision tree and artificial neural network. Iranian journal of public health 45, 9 (2016), 1179.
[55] John Pestian, Henry Nasrallah, Pawel Matykiewicz, Aurora Bennett, and Antoon Leenaars. 2010. Suicide note classification using natural language processing: A content analysis. Biomedical informatics insights, 3:BII–S4706.
[56] Natalie J Jones and Craig Bennell. 2007. The development and validation of statistical prediction rules for discriminating between genuine and simulated suicidenotes. Archives of Suicide Research, 11(2):219–233.
[57] Pete Burnap, Gualtiero Colombo, Rosie Amery, Andrei Hodorog, and Jonathan Scourfield. 2017. Multi-class machine classification of suicide-related communication on twitter. Online social networks and media, 2:32–44.
[58] Tim MH Li, Ben CM Ng, Michael Chau, Paul WCWong, and Paul SF Yip. 2013. Collective intelligence for suicide surveillance in web forums. In Pacific Asia Workshopon Intelligence and Security Informatics, pages 29–37. Springer.
[59] Xiaolei Huang, Xin Li, Tianli Liu, David Chiu, Tingshao Zhu, Lei Zhang. 2015. Topic Model for Identifying Suicidal Ideation in Chinese Microblog. Proceedings of the 29th Pacific Asia Conference on Language, Information and Computation, pages 553–562.
[60] BjornGamback and Utpal Kumar Sikdar. 2017. Using convolutional neural networks toclassify hate-speech. In Proceedings of the First Workshop on Abusive LanguageOnline, pages 85–90.
[61] LeiCao, Huijun Zhang, Ling Feng, Zihan Wei, Xin Wang, Ningyun Li, Xiaohao He: Latent Suicide Risk Detection on Microblog via Suicide-Oriented Word Embeddings and Layered Attention. EMNLP/IJCNLP (1) 2019: 1718-1728
[62] Jared Jashinsky, Scott H Burton, Carl L Hanson, JoshWest, Christophe Giraud-Carrier, Michael D Barnes, and Trenton Argyle. 2014. Tracking suicide risk factors through twitter in the us. Crisis.
[63] Munmun De Choudhury, Emre Kiciman, Mark Dredze, Glen Coppersmith, and Mrinal Kumar. 2016. Dis-covering shifts to suicidal ideation from mental health content insocial media. In Proceedings of the 2016 CHI conference on human factors incomputing systems, pages 2098–2110. ACM.
[64] Xu Lipeng, Song Wenai. Suicide idea detection based on Chinese microblog language features [J]. Journal of North University of China (Natural Science Edition), 2019, 40(04): 350-357.
[65] Manas Gaur, Amanuel Alambo, Joy Prakash Sain, Ugur Kursuncu, Krishnaprasad Thirunarayan, Ramakanth Kavuluru, Amit Sheth, Randy Welton, and Jyotishman Pathak. 2019. Knowledge-aware Assessment of Severity of Suicide Risk for Early Intervention. In The World Wide Web Conference (WWW ’19). Association for Computing Machinery, New York, NY, USA, 514–525.
[66] Rohan Mishra, Pradyumna Prakhar Sinha, Ramit Sawhney, Debanjan Mahata, Puneet Mathur, Rajiv Ratn Shah: SNAP-BATNET: Cascading Author Profiling and Social Network Graphs for Suicide Ideation Detection on Social Media. NAACL-HLT (Student Research Workshop) 2019: 147-156.
[67] Jingcheng Du, Yaoyun Zhang, Jianhong Luo, Yuxi Jia, Qiang Wei, Cui Tao, and HuaXu. 2018. Extracting psychiatric stressors for suicide from social media usingdeep learning. BMC medical informatics and decision making 18, 2 (2018), 43.
[68] Diener E. SubjectiveWell-being. Psychology Bulletin.1984, 95 (2)
[69] DieNer,E., Suh, E. M., Lucas, R. E., & Smith, H. L. (1999). Subjective well-being: Three decades of progress. Psychology Bulletin, 125 , 276–302.
[70] Li Yan, Zhao Jun. Overview of research on happiness [J]. Journal of Shenyang Normal University (Social Science Edition), 2004(02): 22-26.
[71] Xu Xingyu. A summary of subjective happiness [J]. Modern Economic Information, 2017(20):363-364.
[72] Liu Lei, Sun Wujun, Jiang Yuan, Fang Ping. Evaluation and Prospect of Happiness Measurement Index System[J]. China Special Education, 2019(02): 66-73.
[73] Asai, A., Evensen, S., Golshan, B., Halevy, A., Li, V., Lopatenko, A., Stepanov, D.,Suhara, Y., Tan, W.C., Xu, Y.: Happydb: A corpus of 100,000 crowd sourced happy moments. In: Proceedings of LREC 2018. European Language Resources Association(ELRA), Miyazaki, Japan (May 2018).
[74] Jiayin Qi, Xiangling Fu, Ge Zhu. China Subjective well-being measurement based on Chinese grassroots blog text sentiment analysis, J. Qi et al. / Information& Management 52 (2015) 859–869.
[75] Sukjin You, Joel DesArmo, and Soohyung Joo. 2013. Measuring happiness of US cities bymining user-generated text in Flickr. com: a pilot analysis. In Proceedings ofthe 76th ASIS&T Annual Meeting: Beyond the Cloud: Rethinking Information Boundaries (ASIST ’13). American Society for Information Science, USA, Article167, 1–4.
[76] Hao B.,Li L., Gao R., Li A., Zhu T. (2014) Sensing Subjective Well-Being from Social Media. In: ?l?zak D., Schaefer G., Vuong S.T., Kim YS. (eds) Active Media Technology. AMT 2014. Lecture Notes in Computer Science, vol 8610. Springer, Cham.
[77] Shrey Bagroy, Ponnurangam Kumaraguru, and Munmun De Choudhury. 2017. A Social Media Based Index of Mental Well-Being in College Campuses. In Proceedings of the 2017 CHI Conference on Human Factors in Computing Systems (CHI ’17). Association for Computing Machinery, New York, NY, USA, 1634–1646. https://doi.org/10.1145/3025453.3025909
[78] Dodds,P.S., Harris, K.D., Kloumann, I.M., Bliss, C.A., Danforth, C.M.: Temporal patterns of happiness and information in a global social network: Hedonometricsand twitter. PLoS ONE 6(12), e26752 (2011)
[79] Singh,Kuldeep & Shakya, Harish & Biswas, Bhaskar. (2017). Happiness Index inSocial Network. 10.1007/978-981-10-5780-9_24.
[80] Rajendran, A., Zhang, C., Abdul-Mageed, M.: Happy together: Learning and understanding appraisal from natural language. In: Proceedings of the 2nd Workshop on Affective Content Analysis @ AAAI (AffCon2019). Honolulu, Hawaii. (January 2019)
[81] Saxon, M., Bhandari, S., Ruskin, L., Honda, G.: Word pair convolutional model for happy moment classification. In: Proceedings of the 2nd Workshop on Affective Content Analysis @ AAAI (AffCon2019). Honolulu, Hawaii. (January 2019)
[82] Syed, B., Indurthi, V., Shah, K., Gupta, M., Varma, V.: Ingredientsfor happiness: Modeling constructs via semi-supervised content driven inductivetransfer learning. In: Proceedings of the 2nd Workshop on Affective ContentAnalysis @ AAAI (AffCon2019). Honolulu, Hawaii (January 2019)
[83] Holzinger, Andreas, Peter Kieseberg, Edgar R. Weippl and A Min Tjoa. Current Advances, Trends and Challenges of Machine Learning and Knowledge Extraction: From Machine Learning to Explainable AI. CD-MAKE (2018).
[84] H. Muller, M. Mayrhofer, E. Van Veen and A. Holzinger, “The Ten Commandments of Ethical Medical AI” in Computer, vol.54, no.07,pp.119-123, 2021.
TODO List
- 論文內容整理
- 梳理思維導圖
總結
以上是生活随笔為你收集整理的【论文阅读】Computational Personality: A Survey 计算性格学综述的全部內容,希望文章能夠幫你解決所遇到的問題。