APP下载

社会网络用户心理健康自动评估研究综述

2021-03-17刘德喜万常选刘喜平邱祥庆鲍力平朱廷劭

中文信息学报 2021年2期
关键词:自动心理健康特征

李 静,刘德喜,万常选,刘喜平,邱祥庆,鲍力平,朱廷劭

(1. 江西财经大学 信息管理学院,江西 南昌 330013;2. 福建江夏学院 电子信息科学学院,福建 福州 350108;3. 江西财经大学 数据与知识工程江西省高校重点实验室,江西 南昌 330013;4. 中国科学院 心理研究所,北京 100101)

0 引言

心理健康问题正迅速成为世界范围内最严重和最普遍的公共卫生问题之一。世界卫生组织提供的数据显示,全球超过3.5亿人受抑郁症的影响[1],每天约有3 000位抑郁症患者自杀,每年自杀未遂者超过1 000万人,由心理问题导致的自杀是年轻人死亡的三大主要因素之一[2]。抑郁和焦虑在全球人口中的患病率分别约为4.7%和7.3%[3]。这些数据反映了心理健康问题的严重性。因此,对心理健康问题及时评估和干预对提高个人生活质量和促进良好社会心态都具有重要意义。

传统心理学研究对心理健康的评估主要借助于量表、问卷、身体检测等方式来获得个体心理和生理状态的基本信息,在信度和效度上都有不俗的表现,但存在侵入式、费时费力、报告偏差、适时性差、难以长期连续追踪等局限性[4]。社会网络的兴起为心理科学的发展提供了新的契机。用户可以在社交网络平台上便捷、匿名地表达自己的观点、情绪、感受和想法,也可以通过评论帖子和建立对话来与其他用户互动,寻求或提供在线帮助,由此产生出大量关于社会网络用户的行为数据以及用户发布的内容数据。这使得社会网络成为研究抑郁、自我伤害、自杀意念等心理健康问题的一个重要数据来源[5]。通过社会网络数据对用户的心理健康进行评估具有可用数据丰富、适时性强、无侵入、可长期跟踪、评估对象覆盖广、方便存储计算等优势[6],能够有效地克服传统心理健康评估方法的局限性。

利用社会网络数据分析社会网络用户心理健康的研究正吸引着心理学领域和计算机领域的学者的关注,相关的研究成果日益丰富,但对已有成果系统评述的文献却不多见。本文对社会网络用户心理健康自动评估的相关文献进行评述,主要内容包括: 在现有文献基础上总结归纳了社会网络用户心理健康自动评估的概念、界定及研究框架;梳理了社会网络用户心理健康自动评估任务及数据收集与预处理;然后分析比较了现有研究方法的异同;提出了现有研究存在的不足及其他亟待解决的相关问题。

1 概念与界定

1.1 心理健康的问题类型

国内外学者对于心理健康的内涵和标准有着不同角度的论述,这反映了人们对于心理健康的认识的不一致性。原因在于心理健康认定的标准比较抽象,例如美国心理学家马斯洛和米特尔曼提出心理健康十条标准,并指出心理健康的标准与年龄、性别、文化、宗教信仰,甚至国家或地域都有关系。心理健康状态可分为健康状态、不良状态、心理障碍和心理疾病四个等级。在总结现有文献的基础上,本文将心理健康问题狭义地定义为抑郁、焦虑、自杀意念及与心理状态有密切关系的人格障碍、情绪困扰等心理问题。表1汇总了现有文献中较典型的心理健康问题类型和临床描述。

表1 心理健康问题类型和临床描述

1.2 心理健康自动评估的界定

心理评估是依据心理学的理论和方法对人的心理品质及水平所做出的一种鉴定。在应用心理学中经常用心理诊断的概念,它指对人的心理活动和人格特征做出性质和程度的判断和鉴别。本文中,心理健康的评估就是对人的抑郁、自杀意念、焦虑及与心理状态有密切关系的人格障碍、情绪困扰等心理问题和现象状态的鉴定和描述。

随着计算机科学与技术、人工智能、大数据、社会网络的发展,传统心理学研究范式产生了变革,学者越来越依赖数据科学与技术以探索个体或群体的心理和行为规律。因此,心理健康自动评估就是依据数据科学与技术对人的心理问题和状态的自动鉴定和描述。这种自动评估有助于快速定位有心理困扰的个人,自动识别用户心理问题的严重程度,并及时关注和帮助有问题的个人或群体。本文聚焦的社会网络用户心理健康自动评估是指,利用机器学习、自然语言处理等技术对用户生成的社会网络数据自动检测和分析,识别、鉴定用户的心理健康状态、问题类型和程度。

1.3 社会网络用户心理健康自动评估可信度

由于心理健康状态、问题类型和程度的动态性和复杂性,社会网络用户心理健康自动评估是一项复杂的任务。近年来,随着社会网络平台成为人们生活中不可分割的一部分,这一研究领域也开始演变。研究表明,从用户社会网络数据中提取的许多信息可以帮助心理健康专家评估用户心理问题的严重程度,并更好地组织治疗过程[10]。因此,社会网络数据为人类行为提供了一个独特的、可量化的视角,而这些视角可能是其他方式无法观察到的。Ernala等人[6]近期的实证研究表明,建立在这些社会网络数据上的自动预测模型虽然具有很强的内部效度,但在对患者进行测试时,其外部效度较差。然而,这种大规模的用户生成内容提供了一个机会,以前所未有的水平了解潜在的心理健康状况的机制。相关研究已经证实了使用社会网络数据自动评估用户心理健康是有效可行的[6-7,9]。

1.4 社会网络用户心理健康自动评估框架

利用各类社会网络数据自动评估用户的心理健康,被认为是一项复杂的任务,吸引着越来越多来自计算机科学和心理学领域的学者。国际计算语言学年会从2014年开始增加关于计算语言学与临床心理学的研讨会CLPsych(http://clpsych.org),每年举办一次,推动了社会网络数据驱动的心理健康自动评估研究。然而由于隐私、机密性与偏见研究的存在,以及模型的不足、专业知识的缺失或利用不充分,自动检测和预防潜在的心理健康问题仍然是一个重大挑战。

目前,利用社会网络数据进行心理健康自动评估的研究,大部分采用的主要框架是在确定心理健康评估任务后,从社会网络上采集用户数据,并对数据背后的用户心理健康状况进行人工标注,或者通过用户填写自评量表的方式进行标注,再从数据中提取特征送入分类或回归等机器学习模型中训练和测试,并对模型或特征进行评估和改进,最后将模型应用到实际的应用系统中,如图1所示。

图1 社会网络用户心理健康自动评估框架

2 社会网络用户心理健康自动评估任务

利用社会网络进行心理健康自动评估时,评估任务涉及心理健康问题的多个方面,主要集中在抑郁症和自杀风险两方面,也包括压力、创伤后应激障碍、焦虑等其他心理困扰方面,如表2所示(按时间列出以方便读者看到其变化)。

表2 社会网络用户心理健康自动评估代表文献

续表

2.1 抑郁症自动评估

抑郁症自动评估主要是评估社会网络用户是否有抑郁倾向以及抑郁的严重程度。由于社交媒体经常被用来表达情感、感受,因此用户的活动记录和生成内容是用来识别用户抑郁症状的一个很有效的信息来源。

国外学者对社会网络用户的抑郁倾向自动评估关注较早,成果丰富。有学者通过分析社会网络平台上抑郁症用户区别于对照组用户发布内容的语言使用特征和方式来检测抑郁症[55]。后来,社会网络用户的活动记录常被用于评估抑郁程度[11]。越来越多的学者利用社会网络中更丰富的数据来预测或检测抑郁症、抑郁情绪或抑郁风险[14,21-22]。

国内相关研究起步较晚,但也取得了一定的成果。中科院心理所朱廷劭团队通过提取社会网络用户的语言和行为特征,分别建立了分类和回归模型[56]。结果显示,用户的抑郁症可以通过社会网络数据预测。后来他们又提出了一种通过网络行为时频分析来检测抑郁症的新方法[57]。不同于使用完全公开的社会网络数据,刘德喜等人[35]探讨了利用准私密社交网络(如QQ空间、微信朋友圈等)数据检测抑郁用户的可行性。

2.2 自杀风险自动评估

自杀风险自动评估是指识别社会网络平台用户的自杀意念、自杀倾向或自杀风险因素,做出个体是否可能自杀的判断。

国外学者早期工作试图分析自杀遗书内容来预测自杀风险[58]。随后涌现大量关注社会网络数据成功预测自杀风险的工作。Burnap等人[25]对社会媒体文本进行分类,识别文本中的自杀意念,并分析自杀意念的先兆特征,以帮助解释感知自杀的社交媒体用户使用的语言。Gaur等人[10]将领域特定的知识引入深度学习框架,预测自杀风险。

国内相关研究仍主要来自中科院心理所朱廷劭团队,包括社会网络上自杀死亡与无自杀意念者行为和语言的差异、识别他们的可能性以及识别模型等[13, 26, 41, 52]。Guan等人[13]研究了基于互联网访问数据自动识别中国高自杀可能性微博用户的可行性和有效性。田玮等人[41]对新浪微博文本构建了自杀识别器,准确率可以达到94%以上。

2.3 其他心理健康问题自动评估

除了对抑郁、自杀意念或自杀风险等心理问题的自动评估任务,还有一些学者利用公共社交媒体数据和社会网络文本进行其他心理健康问题类型的自动评估,包括: 压力[30,54]、创伤后应激障碍(PTSD)[24,59]、焦虑[27]、饮食障碍[9,18]、精神分裂症[6,60]等。也有学者对多种心理健康问题同时评估[7]。

在计算语言学与临床心理学工作组(CLPsych)的推动下,利用社会网络数据进行“自我伤害”心理问题自动评估研究也取得了大量成果[17,20,22,28,32,38,53]。CLPsych将社会网络论坛文本的心理健康状态自动分类为四种不同严重程度: 绿色类帖子(Green,没有显示任何关于自我伤害的迹象或讨论)、琥珀类帖子(Amber,包含很可能会显示有心理问题迹象的线索)、红色类帖子(Red,表明用户正遭受较为严重的困扰)和危机类帖子(Crisis,表明用户即将面临自我伤害的风险,需要及时干预)。

3 社交网络用户数据收集与预处理

3.1 数据收集与标注

基于社会网络数据自动评估心理健康的研究中,数据来源涵盖了主要的社会网络平台,包括Twitter[7,9,11-12,14,16-17,19,22,24,32,37,39]、Facebook[6]、Reddit[10,21,27,31,33,38-39,43,46]、ReachOut[20-21,28,53]、Tumblr[25]、Instagram[18,23,34]、新浪腾讯微博[1,13,26,41,56-57]、微信朋友圈[35]、博客[42,61]等。其中相对来说更受研究者青睐的数据来源是Twitter、Reddit、微博等,这些平台本身非常流行,活跃用户量非常大,聚集了大量用户生成内容,便于收集和分析。

在社会网络用户心理健康自动评估研究中,数据收集和标注的方式主要有三种。一种是通过社会网络平台或亚马逊的Mechanical Turk网站等众包平台招募社会网络用户参与调查(如抑郁量表、自杀概率量表、创伤筛查问卷等),在要求提供知情同意的情况下收集用户相应时间段的社会网络数据[11,13,16,23-24,34,56]。这种方式通常以调查结果作为心理健康等级或程度的标注依据。另一种是从现有的公共在线资源收集数据,主要是通过关键字或正则表达式搜索提及自我报告或声明被诊断为心理问题的相关帖子,如“我被诊断出患有×××症”[14,21,25,31,33],调用相应的社会网络平台应用程序接口(API)收集用户的社会网络数据。这种方式通常以自我声明作为用户心理健康社会网络数据的标注依据。第三种是在收集社会网络平台上的数据(通常是文本)后,由受过培训的专业人员或心理专家,在阅读数据的基础上人工判断并标注文本是否反映了其作者的某种心理问题[5,17,20,22,27,29,32,38,44]。

在构建数据集的过程中,三种数据标注的方式存在一定的差异,各有优缺点。第一种采用量表结果作为心理健康等级的方式,可以得到相对可靠的结果,具有较高的有效性,但并非所有参与调查的用户都能准确地或自愿地报告自己的心理健康状态。第二种方式采用自我报告作为心理健康状态类别标签,减少了识别心理问题用户的时间和成本,而且具有更大样本量所具有的优势,比通过调查收集数据更快、更便宜,但也存在不一定真实可信的情况。第三种人工标注的方式不直接依赖社会网络用户,样本规模容易控制,标注质量较好,但人工标注主观性强,而且由于数据量大,比较耗时费力。

对心理问题等级或程度的划分通常有两种形式。一种是二元划分,如果帖子的作者明显有抑郁倾向或自杀的想法,那么这个帖子就被标记为1;否则被标记为0[1,39-41,43,47,49]。另一种是多元划分,将帖子标注为心理问题的不同严重程度[20-21,28,38,42,44,50,52-53],如无、低度、中度、高度风险四个级别。除了按心理问题程度划分外,也有研究[25]根据任务需要,按与自杀相关的不同类型对帖子进行划分,分为可能有自杀意图的证据、运动请愿、轻率地提及自杀、信息或支持、纪念或哀悼、自杀的报道、其他等。

3.2 数据预处理

对收集的数据进行清洗和必要的预处理是数据收集阶段的必要步骤。数据清洗是去除不符合要求的数据,例如,删除发布总数少于100个有效帖子的用户[1,19]、删除任何潜在的可识别用户名[14,17,28]、过滤掉不表达自己观点的转发帖子[1]等。预处理则根据任务的需要和特征提取的需要,通常包括: 去除停用词和标点符号[1,15,27,32,40,46],删除所有的HTTP链接和多余空格等[1],删除所有的转发[22]、URL[17,19,22,46]、@提到[22,41]和所有非字母数字字符[32,38],将表情符号和表情符号对应的文本进行转换[20,38,53],分词[32,35,41],应用词干提取将单词简化为词根形式[46],创建词汇表[32]等等。

3.3 特征提取与选择

特征提取与选择是从原始特征中提取和选择出一些有效特征,以降低数据集维度并提升评估性能的过程。对于后续的分类模型来说,特征的提取与选择起着决定性作用。已有文献中,用于心理健康自动评估的特征可以归入以下三类: 用户特征、文本特征、图像特征。

3.3.1 用户特征

根据社交媒体网站的特点,用户特征主要包括用户属性、用户行为、用户互动关系三个方面的特征。研究表明,用户在社会网络平台上的注册信息、活跃程度、行为习惯和社会关系都与用户心理健康状态紧密相关。

用户属性特征描述了用户在社会网络平台上的整体形象,主要包括用户帖子数量、关注(好友)数量、粉丝数量、注册天数、性别、年龄、级别和地区代码等[1,9,19-20,22,50]。用户行为特征刻画了用户在社会网络平台上的行为表现[1,28,35,37,53],如用户在社交网络平台上发帖、点赞、评论、关注等行为,反映在发帖频率[11,19],点赞或评论、转发频率(或数量)[11],被提及频率[19],在社交网络平台上的活跃时间段[28],关注(好友)等特征上。此外,社会网络平台包含了数百万用户之间的交互和关系[44]。用户互动关系特征是指用户与外部世界交互的方式[9],如用户是否倾向于关注各种主题或特定的主题,用户是否喜欢与不同的人或特定的人互动,用户与他人互动的形式(提及和回复),用户与他人的亲密度,用户的社会网络结构特征等。

3.3.2 文本特征

文本特征主要包括词汇、语法、句法、语义等用于刻画用户发布的文本内容各方面特点的特征。不同心理健康状态的用户在语言表达、用词风格等方面有着较大差异。从文本文档中检测心理健康状况已经成为一个越来越重要的研究领域[62]。

词典是提取文本语言特征时的常用资源。如语言查询和单词计数(LIWC)词典在文本分析中得到了很好的验证和广泛的应用[5-6,33,43,46,53]。除LIWC外,已有的研究中使用较多的词典是情感词典。英文情感词典有labMT[10]、ANEW[34]、SentiWordNet[36]、AFINN[10]、NRC Word-Emotion Association Lexicon[33,38]等;汉语情感词典有SCLIWC[52]、知网HowNet[63]、中文情感词汇本体CALO[1]等。其中SCLIWC是LIWC的简体中文版本,它由7个主要类别和64个子类别组成[52]。HowNet主要用于粗粒度的情感分析,如正面或负面情感,而CALO主要用于细粒度的情感分析[1]。

在表示文本内容方面,常用的特征是N-Gram和主题。N-Gram特征[46,53,63-64]的基本思想是将文本内容按照字母、字或词进行大小为n的滑动窗口操作,形成长度为n的片段序列,使用词频逆文档频率(TF-IDF)对片段进行加权,用于表示文本内容。主题建模技术如潜在狄利克雷分布(LDA)被用于从用户生成的帖子中提取主题特征[11,46,50,53,63-64]。给定文档集和主题数量,使用LDA从每个帖子中提取主题,然后计算每个帖子属于每个主题的概率,用于表示文本的内容。

随着深度学习的广泛应用,越来越多的研究采用基于词向量的特征提取技术。分布式表示方法能够保存文本中的语义信息,在许多自然语言处理任务中得到广泛应用。词向量模型如Word2Vec[32,53,63]、Doc2Vec[27]、BERT[50,64]等被用于提取词嵌入特征,从而更好地利用上下文信息。Word2Vec通过训练大量的语料最终用固定维度的向量来表示每个词语,词语之间语义和语法相似度都可以通过向量的相似度来表示。Doc2Vec是Word2Vec的拓展,可以获得句子、段落的向量表示。BERT模型进一步增加词向量模型泛化能力,充分描述字符级、词级、句子级,甚至句间关系特征。

其他文本特征,如词性频数[33]、句法特征[63]、可读性[10,33]等也有文献使用。有少量文献提取了文本的统计特征[40,50],如文本的长度,帖子中单词、短语、字符、句子和段落的数量等。从用户发帖的上下文可以捕捉到用户思想的发展变化[20,28],其也是近来被提取的重要特征,如考虑用户以前的帖子,以及周围其他用户的(以前和下一个)帖子。此外,社交媒体上的帖子往往含有丰富的网络用语和表情符号[1]。

3.3.3 图像特征

除了发布文本,社交媒体平台还允许用户发布图像。已有的研究大多将图像特征与文本特征结合使用,来评估用户的心理健康状态[48]。如Reece等人[23]利用图像中三种颜色属性(色调、饱和度、明度)的值(HSV值)作为区分抑郁症用户的图像特征。Manikonda等人[65]除了利用图像视觉特征如颜色、亮度、色温等,还利用了图像的主题和情感两种视觉属性。Kang等人[66]采用颜色组合和尺度变换、特征描述符技术提取用户发布图片的情感意义。研究表明[65],使用图像来满足独特的自我表露需求,在数量和质量上都与通过文本形式共享的内容不同,可以用来作为心理健康自动评估的重要特征之一。

4 社会网络用户心理健康自动评估模型构建

利用社会网络数据对用户心理健康进行自动评估的研究多采用有监督机器学习模型中的分类模型,选择一组选定的特征,从训练数据中学习模式并提供预测输出。自动评估方法主要是传统机器学习方法和近年来流行的深度学习方法。这两类方法的差异性主要在于传统机器学习方法依赖于特征工程,而深度学习方法主要依赖于嵌入。

4.1 基于特征工程的分类模型

已有的研究选择使用的机器学习模型有简有繁、种类繁多,其中支持向量机(SVM)被广泛采用[1,6,10,38,42,52-53],包括线性SVM[10,42]、多项式SVM[42]、径向基核函数SVM[10,43,67]等。另一种被经常采用的模型是各种回归模型,如线性回归[34,61]、逻辑回归(LR)[6,40,43,46,50,52]、弹性网络正则化回归[34]、正则多项式逻辑回归[18]等。其他分类算法还有决策树(DT)[52]、随机森林(RF)[6,10,39,40,43,46,52]、规则决策[40]、朴素贝叶斯[5]等。

传统机器学习分类模型都需要在对数据统计分析的基础上,提取和选择有利于区分类别的特征,特征工程的效果直接影响分类结果。已有的研究表明[46],通过选择合适的特征及对多种特征组合,可以提高分类性能。

然而,这种人工设计特征的方式,需要研究人员对心理健康自动评估问题有深刻的理解和丰富的经验,这会消耗大量的人力和时间,即便如此也往往很难获得有效的特征。

基于特征工程的分类模型是预测心理特征和情绪以及检测评估心理健康状态最广泛使用的方法,已被应用于不同类型的心理问题自动评估领域。很多文献通过实验从不同角度比较了这些模型在心理健康自动评估中的效果。在前述已有研究选择的机器学习模型中,通常SVM的效果优于其他方法。

4.2 基于深度学习的分类模型

随着深度神经网络在其他领域的成功应用,近年来,有学者将深度神经网络模型用于心理健康自动评估中[29,32-33,36,41,50]。如田玮等人[41]验证了多层感知机(MLP)模型比随机森林和朴素贝叶斯方法具有更高的识别准确率。

与传统机器学习分类模型相比,使用词嵌入的深度学习非常方便,即使没有复杂的特征工程,通常也能获得较好的结果。如Orabi等人[32]预训练了Word2Vec的两个词嵌入模型,送入卷积神经网络CNN和循环神经网络RNN,F1值达到86.967%。Mohammadi等人[51]使用GLOVE和ELMo作为预训练词嵌入向量,输入神经网络模型,在CLPsych 2019共享任务中获得两个任务排名第一的结果。Matero等人[50]使用了双上下文BERT嵌入方法,在测试集上优于其他方法。

最常用的神经网络结构是用户级或帖子级的CNN[10,21,30,32-33]。如Orabi等人[32]在Word2Vec词嵌入基础上构建了四个神经网络模型(最大池化层的CNN、多通道CNN、多通道池化CNN、带有注意力机制的双向LSTM),在两个不同数据集上的实验表明,基于CNN的模型性能优于基于RNN的模型。

其他经常使用的架构是长短时记忆(LSTM)网络[40,47,50]。与RNN相比,LSTM模型对噪声的鲁棒性更强,并且能够更好地捕捉序列中的长期依赖关系。如Sawhney等人[40]的实验结果表明,LSTM在同等的条件下获得了最高的召回率。

尽管深度神经网络表现良好,但由于模型的可解释性差,无法通过模型来解释为什么某些人被诊断为×××症,但可解释性对于后续的具体诊断和预防研究却是至关重要的。针对这个问题,Song等人[36]提出了一种特征注意网络(FAN),使用了四种从心理学研究中提取的抑郁症强指标,并针对性地开发了四种神经网络模型。该模型虽然计算能力有限,但具有良好的性能和较高的可解释性。

由于上述提及的各种方法针对的任务、使用的数据集和选择的特征差异较大,各模型的性能对比有较大的挑战性(如5.1节所示),本文不再对它们的性能做详尽的对比分析。

5 问题和挑战

社会网络用户心理健康自动评估的问题越来越被心理学、计算机、临床医学乃至管理学等专业的学者关注,取得了不少成果,但现有研究还存在一些局限和挑战。

5.1 评估性能问题

对社会网络用户心理健康自动评估方法的评价指标有精度(P)、召回率(R)、F1值和准确率(Acc)等。相同的任务和方法,在不同的数据集上可能产生不同的结果。如对于自杀风险评估任务,现有研究的评估准确率大多在80%以上,少数达到95%[39],也有文献中只能达到59%[50]。这跟数据集大小、数据标注方式和标注质量、类别标签的设定、预处理、参数设置、特征选择等有很大关系。不同的文献存在着诸多方面的差异,表3给出了不同任务上表现较好的评测结果。

表3 社会网络用户心理健康自动评估部分代表性文献性能对比

如前所述,每一种方法都有其特点,其性能取决于研究目的和数据性质。因此,对于社会网络用户心理健康自动评估方法的好坏无法一概而论,不能说一个特定的算法在任何时候都适用于所有任务或数据集。研究人员需要对算法的选择保持谨慎,阐明他们选择的依据,并在恰当的数据集上进行评测。

虽然各种机器学习模型在实验集上可能看起来很有前途,但这些评测结果大都是基于“封闭测试”得到的,其中数据集中的正负样本数量也是相对均衡的,因此,在实际环境中部署可能会带来新的挑战。

5.2 数据质量问题

数据量大毫无疑问是社会网络数据的一大优势,但相关研究的技术难点是如何保证海量数据的质量。数据质量问题来自两个方面,数据源质量和数据标注质量。

数据源方面。社会网络用户数据具有多源异构、动态性、交互性等特点,也有噪声数据多、价值密度低等特征,这使得在关于社会网络用户心理健康评估的研究中数据质量参差不齐。另外,社会网络用户数据虽然样本量大,但大量无关心理健康问题的用户数据,可能造成混淆或难以辨识的问题。而且由于社会网络内容并不总是反映用户真实的心理状况,因此,数据集可能包含一些与心理问题相关的假阳性文本内容。

数据标注方面。传统问卷量表通常由人为设计,有不少研究利用量表数据作为心理危机程度的诊断标签。尽管能收集到较高质量的标签,但以此方法获取的样本容量往往有限。自动发现法可以节省一定时间和成本,但存在大量噪声和误导信息。人工标注法往往准确且数据质量高,但不少研究工作中人工标注数据集的过程并未取得很高的一致性,且人工标注方法代价大,标注的样本容量有限。

总的来说,数据量大并不能一定保证数据质量高,也不能一定保证数据真实可靠。因此,在利用社会网络数据评估识别心理问题用户的研究中,如何去除噪声又提高数据质量是值得探索的问题和挑战。

5.3 隐私伦理问题

基于社交媒体的心理健康评估的研究涉及数据隐私、信息泄露等许多问题。数据隐私是一个持续被关注的问题。例如,识别出的高危用户信息可能被雇主和保险公司利用。由于用户一旦被贴上心理问题的标签,可能导致被歧视或嘲笑,因此需要数据保护和所有权框架协议来确保用户不会受到伤害。如何在社会网络用户的心理健康自动评估的研究中既能保证一定的学术研究质量,又能充分尊重和保障用户的合法权益,是需要学者和业界关注的问题。

对于学术研究而言,可以建立一定的数据使用原则,共同遵循和监督,充分保障用户个人隐私。对于临床应用而言,尤其是当数据来源与患者的社交媒体活动有关时,需要有适当的临床风险管理协议[68]。

5.4 原因抽取问题

目前利用社会网络数据开展心理健康分析的工作主要集中在心理问题的识别检测上,即利用社会网络上用户的静态属性特征、行为特征、文本内容特征等,通过分类、回归等机器学习模型,对用户心理健康状况进行识别。然而,心理健康自动评估研究的最终目的是帮助心理辅导专家快速定位到需要帮助的个体,快速分析产生的原因,并给予有针对性的辅导或治疗,预防心理问题严重程度的加剧。

预防心理问题的第一步是确定与心理问题相关的危险因素和原因。心理问题的原因可能很复杂且因人而异。心理问题原因的自动识别对于提供量身定制和精确的干预策略至关重要。因此,很有必要从用户发布的文本集合与用户参与网络的行为集合中自动抽取蕴含有心理问题产生的原因或线索。然而,很少有人提出用自动化的方法从社会网络用户数据中提取心理问题产生原因或心理压力源[69]。

5.5 自动干预问题

由于社会网络用户对心理问题的羞耻感,导致高危用户寻求心理机构或医生帮助的动机不足。但社会网络的发展和适当的匿名机制促使用户积极寻求网络咨询或网络支持。因此,需要建立机制,将科学研究工作与社交网络平台上的网络干预措施结合起来。目前社会网络用户心理健康自动评估的准确率已经有很大提高。如果能够通过社会网络在自动识别出高危用户的同时给予自动干预,改善用户的心理状况,就能在减轻心理辅导专家负担的同时,使心理辅导的介入更及时。因此,如何根据用户心理问题严重程度并结合用户兴趣进行自动干预也是一项挑战。自动干预与传统心理干预方式相比,具有及时、大规模、无侵扰性等优势。迄今为止,很少有工作致力于通过这些在线社区为参与者提供自动干预。

6 结语

社会网络用户心理健康自动评估是社会网络、心理信息、计算语言学等研究领域的热点话题。机器学习和自然语言处理的进步,为从大规模社会网络数据中自动评估用户心理问题严重程度提供了巨大的机会。针对这一研究问题,本文归纳界定了社会网络用户心理健康自动评估的基本概念,梳理了近几年利用社会网络数据进行心理健康评估的研究,比较了不同自动评估模型方法的优缺点及适用性,讨论了当前社会网络用户心理健康自动评估研究的局限性和面临的挑战。

从当前的研究趋势来看,尽管社会网络数据可能会填补传统数据收集的空白,然而由于高危用户可能会停止生成社会网络内容,因此,未来的研究也应该结合其他数据流,如结构化临床访谈、电子健康记录、智能终端数据等,以提高自动评估的准确性和可靠性。

目前对社会网络用户心理健康的自动评估的准确率已经有了很大提高,但为了更好、更准确地定位具有高危风险的用户,还需要患者、临床医生和数据科学家之间开展更全面的合作来共享和协调数据,以提高分类性能,最大限度地评估所开发模型的实用性。此外,随着机器学习工具越来越容易为研究人员和临床医生所使用,加上政府及公众对心理健康问题重视程度越来越高,未来这一领域将继续发展,并将在心理健康问题的原因提取、预防疏导等方面得到新的应用。

猜你喜欢

自动心理健康特征
心理健康
心理健康
心理健康
心理健康
自动捕盗机
如何表达“特征”
不忠诚的四个特征
抓住特征巧观察
让小鸭子自动转身
自动摇摆的“跷跷板”