基于社交媒体大数据的大学生心理危机预警
2021-08-23李彤彤李坦郭栩宁
李彤彤 李坦 郭栩宁
摘要:因心理问题所引发的大学生自杀、犯罪等恶性事件呈逐年上升趋势,大学生心理危机成为社会各界关注的焦点。心理危机预警是心理健康教育的关键环节,而当前普遍采用的基于临床诊断量表的心理危机筛查方法存在误差大、效率低、时效性差等问题。社交媒体大数据为实时、准确地进行大学生心理危机筛查提供了新的思路,心理学相关研究也表明可以通过情绪变化来预测心理危机。基于此构建的大学生心理危机预警模型及其算法以应激事件和人格特质计算为基础,通过分析个体不同类型情绪的强度和阈值判断其情绪表现,进而基于时间序列上情绪的变化对其面临的心理危机风险水平进行测算,从而实现对大学生心理危机的预警。仿真实验结果表明,该方法可以反映出大学生在遭受应激事件时的情绪变化过程,能够对其心理危机进行有效预警。
关键词:心理健康教育;心理危机预警;社交媒体大数据;应激事件;人格特质
中图分类号:G434 文献标识码:A 文章编号:1009-5195(2021)04-0092-12 doi10.3969/j.issn.1009-5195.2021.04.010
基金项目:2017年度国家社会科学基金青年项目“基于社交媒体大数据的大学生心理危机预警机制研究”(17CSH043)。
作者简介:李彤彤,博士,副教授,硕士生导师,天津师范大学教育学部教育技术系(天津 300387);李坦、郭栩宁,硕士研究生,天津师范大学教育学部教育技术系(天津 300387)。
一、引言
当前,由于心理问题所引发的大学生自杀、犯罪等恶性事件呈逐年上升趋势,给高校日常管理、大学生全面健康发展、家庭及社会稳定等带来了极为严重的负面影响,大学生心理危机已然成为社会各界关注的焦点。心理危机是个体或群体在其心理能力不足以面对困难情境时产生的,可能会引发对自身、他人或社会造成严重危害的短暂紧急性心理失衡状态(姜土生等,2013)。心理危机会严重影响大学生的学业与生活,进而引发各种恶性事件。
国内外大多数学者认同“大学生心理危机可防可控”的观点。高校在心理危机的防控上主要采用两种方式:一是通过通识课程培养学生健康的心理素质;二是通过主动报告、量表测量、心理咨询等方式发现学生的心理问题,再有针对性地采取防范措施减少危机发生。第二种方式就是心理危机预警,其本质是对心理危机进行早期预测。及时正确地筛查出存在心理健康问题的学生,并实施不同级别的关注和监护是高校学生心理危机预警的重点和难点。目前我国大部分高校尚未建立规范系统的大学生心理危机预警机制;关于大学生心理危机预警的研究也大多停留在理论阶段,欠缺可操作的方法;而且普遍采用的“基于临床诊断量表进行统计分析”的心理危机筛查方法又存在测量误差大、指标单一、效率低、时效性差等问题。因此,亟需构建一种具有可操作性、科学性、时效性的大学生心理危机预警方法来应对以上问题。
社交媒体(如微信、微博等)的广泛应用,以及大数据技术的发展为解决上述问题提供了新的思路。当前,社交媒体已经成为大学生记录生活、表达观点、分享交流的主要途径,能够反映大学生的真实状态。真实、准确、及时的社交媒体大数据样本为大学生心理危机筛查方法变革带来了新的契机。大数据技术可以通过记录社交媒体上大学生的日常行为数据来分析他们的心理状态及特征,及时发现个体存在的心理健康风险,有利于大学生心理危机的早发现、早干预。本研究立足于深度挖掘具有真实性、实时性的社交媒体大数据,基于心理学的应激反应理论和人格理论建立心理危机预警模型,设计相应算法并进行仿真实验,以期为应用大数据进行大学生心理危机预警提供一定的参考。
二、研究综述
大学生心理危机预警方法从技术发展视角可以分为三种:传统预警方法、信息化系统辅助预警、大数据技术辅助预警。
1.传统预警方法
早期对于心理危机的筛查普遍采用“基于临床诊断量表进行统计分析”,该方法主要依据心理学相关理论确定预警指标,开发设计量表,再由大学生本人主动或被动填写量表,进而通过数据统计分析判断学生的心理危机状态。针对不同类型的危机状态现今都有相应的测量量表。针对自杀意念的测量,典型量表有Beck等(1979)研发的自杀意念量表(Scale for Suicide Ideation,SSI-C)、Reynolds(1991)设计的成人自杀意念问卷(Adult Suicidal Ideation Questionnaire,ASIQ)、Cull等(1982)编制的自杀可能性量表(Suicide Probability Scale,SPS)等。针对抑郁症状测量,典型量表有抑郁症状自评量表(Symptom Checklist 90,SCL-90)(Beck et al.,1961)、汉密尔顿抑郁量表(Hamilton Depression Scale,HAMD)(Hamiton,1960)等。针对焦虑症状测量,典型量表有汉密尔顿焦虑量表(Hamilton Anxiety Scale,HAMA)(Hamiton,1959)、焦虑自评量表(Self-Rating Anxiety Scale,SAS)(Zung,1971)、状态—特质焦虑问卷(State-Trait Anxiety Inventory,STAI)(Spielberger et al.,1970)等。早期“基于临床诊断量表进行统计分析”的心理危机筛查,其数据大都来自纸质问卷调查,多为静态的、实验性的数据,存在测量误差大、指标单一、效率低、时效性差等问题。
2.信息化系统辅助预警
随着计算机、互联网等信息技术的不断发展,数字化智能云平台已经渗透到高校管理的方方面面,应用信息化系统进行预警也已成为高校常态化的心理危机管理方式。教育部普通高等学校学生心理健康教育专家指导委员会组织研发的“中国大学生心理健康测评系统”现已被多所高校试用,也有许多高校自主开发了大学生心理健康普查平台。借助这些系统对大学生进行心理普查,克服了传统的纸笔心理测试存在的耗时、费力、统计结果准确性低及信息反馈滞后等缺陷。但由于心理普查具有“筛查问题”的导向性(邱亚飞等,2020),大学生常常因为害怕被贴上“有心理问题”的负面标签而对此产生抵触心理,不会如实进行信息填写,也致使心理普查结果不准确。除了专门的心理普查系统外,许多高校还同时使用学生信息管理系统辅助心理危机的发现,如设立线上咨询、线下排查通道来督促学生主动完善心理管理信息,综合学生在校期间所遭遇的应激事件、參与的心理普查等数据,以此打破心理档案内容单一的僵局(钱春霞等,2015)。
信息化系统与传统纸笔心理测试相比,准确性和效率都有所提高,但是现有系统大都只能客观地记录学生心理健康状态指标,数据处理大多停留在简单统计、存取、备份、查询等层面,数据并未得到充分利用。
3.大数据技术辅助预警
随着大数据技术的发展,研究者开始尝试将大数据技术用于心理危机预警。学生信息系统中积累的大量数据,以及学生在社交媒体上产生的数据,为心理危机预警提供了丰富的数据资源和广阔的挖掘空间。针对高校学生信息系统或心理健康测评系统等平台上的数据,国内外研究者开始采用一些数据挖掘技术,如决策树、关联规则、神经网络等,进行心理危机发现与预测等。例如鲁玮(2019)通过决策树C4.5算法建立了抑郁症决策模型,发现学生抑郁与性别、户口、家庭情况以及是否独生子女有关;通过关联规则算法对不同特征数据间的关系进行挖掘,发现具有躯体化障碍的学生同时伴有抑郁、敌对等症状。梁娟等(2018)使用关联规则算法(Apriori算法)对学生信息管理系统中的数据进行分析,发现大学生的焦虑、抑郁、自杀倾向等心理危机关联度较为紧密。黄中海(2015)利用高校心理普查数据库中的记录,分别采用CART决策树算法、BP神经网络算法、模式识别网络算法进行数据挖掘并建立预测模型,发现总分、强迫症状得分和偏执症状态得分在大学生心理危机预测中的重要性程度较高,CART决策树算法和模式识别网络算法在学生心理危机预警上具有较高的准确度。
随着社交媒体的广泛应用,越来越多的研究者开始探索通过对社交媒体大数据的分析进行心理危机预警。对于学生在社交媒体上发布的数据,研究者多采用计算机领域的统计分析方法进行分析。如田玮等(2018)建立了基于多层神经网络(Multi-Layer
Perception,MLP)的自杀预警模型;杨芳等(2019)结合知识图谱技术开发了一种自杀监控机器人系统,该系统可以对自杀风险等级进行分析;庄婷婷等(2019)为了解决标注数据集存在数据分布不均匀的问题,提出了一种基于分层支持向量机技术的微博用户自杀倾向预测算法,实验发现该预警算法的准确度高达84.8%;白朔天等(2014)为了探究基于社交媒体数据预测用户抑郁和焦虑心理危机的可能性,通过采集志愿者用户昵称、性别、粉丝数等45项微博特征数据训练多任务回归算法(Multi-Task Regression),并建立了相应预测模型,该算法在神经质上F值为7.90,在焦虑预测上F值为9.82,在抑郁预测上F值为8.38。
大数据技术在心理危机预警中的运用改善了数据来源少、分析工作量大、耗时长等问题,但是当前基于社交媒体大数据进行心理危机发现的算法多采用计算机领域的统计分析方法,缺乏有效的心理学理论模型支撑,无法真正揭示心理危机的本质。
4.现状述评
综上所述,国内外学者一直致力于心理危机预警的研究,也开始采用数据挖掘技术来寻求更精确的预警方法,但是,当前大数据用于心理危机预警的研究仍然处于探索阶段,还有一些问题亟待解决:一是当前普遍采用的“基于临床诊断量表进行统计分析”方法采集的多为静态的、实验性的数据,存在测量误差大、指标单一、效率低、时效性差等问题。二是基于社交媒体大数据进行心理危机预警多针对单一的危机类型,算法多采用计算机领域的统计分析方法,缺乏有效的理论支撑,导致模型的可解释性较差。
针对当前大学生心理危机预警的现实需求以及现有研究存在的不足,本研究立足于深度挖掘具有真实性、实时性的社交媒体大数据,以期发现或预测可能存在心理危机的学生。为了使模型具备较高的可解释性,本研究首先基于心理学的应激反应和人格理论建立预警理论模型,再基于理论模型设计分析算法,并在此基础上进行仿真实验。相比传统的预警机制,基于社交媒体大数据的心理危机预警具有可操作性和实效性强的特点,能够在一定程度上提高预警的有效性和准确性,从而有助于减少大学生因心理危机导致的自杀、犯罪等行为。同時,该方法也可以为高校大学生心理危机管理提供直接支持,并为区域及国家层面实施相关的心理危机管理提供工具范例,对于心理危机管理有着重要的现实意义。
三、理论依据及模型构建
1.心理危机预警的理论依据
(1)应激反应理论
心理危机是一种个体自身运用寻常方式不能应对所遭遇的内外困扰时的心理反应。它一般发生于个体遇到无法避免的、强度较大的应激事件时,经个体评价后认为该应激事件会对个体的地位、安全产生危害,并在动用个体所具备的应对手段全部失败后,个体会产生明显的急性情绪、认知及行为上的功能紊乱(李祚等,2012)。这里提到的应激事件又称生活事件,是引起应激的刺激,也就是应激的起因,它主要有四种类型:躯体性事件、心理性事件、文化性事件和社会性事件(曾红,2012)。躯体性事件是指直接作用于个体机体从而产生应激的事件,如高温、疾病或机体遭受打击等;心理性事件是指由于心理冲突导致应激的事件,如对某次考试成绩有过高的期待等;文化性事件是指由于生活方式、宗教信仰等改变导致应激的事件,如留学海外等;社会性事件是指由于社会事件引起的应激,如社会动乱、人际关系紧张等。对于应激反应(应激所产生的结果)的类型,Lazarus等(1984)将其分为生理、心理和行为反应三类。其中,心理反应一般包括情绪反应和认知反应,常见的情绪反应有焦虑、恐惧、抑郁、愤怒等;常见的认知反应有偏执、反复沉思、否认、选择性遗忘等。生理反应主要指由于应激事件引起的血压、呼吸等生理指标变化(姜乾金,2010)。行为反应一般包括逃避、退化、敌对、自怜等。
由应激事件引发应激反应会经历一定的过程,基于此Horowitz提出了应激反应的阶段模型,如图1所示。该模型将应激反应过程分为5个阶段,分别是惊叫、否认、侵入、不断修正和结束。临床上经常观察到的是否认和侵入两个阶段的状态,而其他应激反应状态是否出现、表现程度如何以及表现顺序怎样等均因人而异。否认阶段通常有情绪麻木、概念回避及行为束缚等综合症状;侵入阶段则是应激性事件直接的、符号性的、观念性的或情感性的反复再现或闪回,比如有关应激事件的梦魇、反复的自发映像或其他事件派生的吃惊反应(李祚等,2012)。当应激反应过强或持续时间过长,就会导致个体出现病理学症状,如惊慌、筋疲力尽甚至自杀等危机状态。
有研究表明,应激事件所引起的应激反应主要是心理反应,而心理反应主要体现在情绪反应上,其不仅指遇到不能应对的应激事件时的负面情绪,还指当可以解决应激事件时所产生的积极情绪(曾红,2012)。当人与所处的环境不能保持平衡时,个体对所处的不平衡状态评价后认为该状态会对自身安全、地位等产生威胁时便会进入应激状态;当个体缺乏相应的社会支持、缺少应对技巧时便会产生诸多情绪问题,如紧张、焦虑、抑郁等;由于个体无法承受极度紧张和焦虑,可能会发生情绪崩溃或想寻求解脱,由此便会导致情绪失衡,从而进入危机状态(李祚等,2012)。通过以上分析可以得出,情绪是心理危机可能发生的直接表现,情绪变化剧烈或负面情绪持续时间过长都有可能标志着学生进入了危机状态。因此,通过识别并持续观测那些情绪剧烈变化、负面情绪持续时间较长的学生,是发现心理危机的一种可行方法。
(2)人格理论
应激事件是个体产生情绪反应的外部诱因,然而,面对相同的应激事件时,每个个体的应对方式是不同的,所产生的情绪反应也会不同,这在很大程度上受个体人格特质的影响。大量实证研究表明,人格是影响情绪表达的重要因素(Watson et al.,1984;Zelenski et al.,1999;Martin et al.,2000;Lucas et al.,2001)。同时研究也证实,心理危机与个体人格存在一定关系(邱鸿钟,2009)。人格特质也被称为个性特征,是决定一个人行为和思想的内部身心系统的动力组织(Miwa et al.,2001)。不同的心理学家提出了不同的人格模型,其中被普遍认可的是“大五”人格模型(The Big Five)(Corr et al.,2009)。“大五”人格模型将人格划分为开放型、谨慎型、外倾型、宜人型以及神经质型5类。开放型人格特征的人富有想象力、感情丰富、具有创造性等特点;谨慎型人格特征的人具有公正、谨慎、克制等特点;外倾型人格的人具有热情、果断、冒险以及客观等特点;宜人型人格的人具有信心、直率、依从等特点;神经质型人格的人具有焦虑、敌对、冲动等特点。人格特质是学生产生个性化情绪变化的内因,如具有开放型人格的学生面对挫折时表现得更乐观,会更积极地去解决困难;具有神经质人格的学生在面对相同挫折时则容易表现得消极。
2.心理危机预警模型构建
根据以上理论分析可知,情绪反应是心理危机的直接表现,因此,可以通过持续观测情绪来预警心理危机。本研究所述的社交媒体大数据主要是指学生发布在社交媒体上的文本、图片等,基于此进行的直接情绪观测(如计算机领域的文本情感分类方法)往往不够准确。而人格特质和应激事件是情緒变化的内外诱因,因此,本研究提出基于应激事件和人格来预测情绪,构建了如图2所示的基于社交媒体大数据的心理危机预警模型。通过对不同类型情绪的情绪强度与情绪阈值的计算判断情绪表现,同时基于时间序列上情绪的变化来判断学生所面临的心理危机风险水平。如果情绪强度过强(情绪变化剧烈)或负向情绪持续时间过长,都表明该学生存在心理危机风险。
(1)数据源层
据中国互联网络信息中心(CNNIC)统计,大学生所处的年龄段群体使用最多的社交应用之一是新浪微博(中国互联网络信息中心,2017)。新浪微博中累积了大量具有客观性、时效性的用户数据,同时其数据可以通过API获得,因此本研究主要从该社交媒体获取数据。学生在新浪微博中的数据一般包括两类:一类是静态数据,如学校信息、昵称、出生年月、兴趣领域等;另一类是动态数据,主要是学生发布的博文。通过新浪微博提供的API,可以对上述学生数据进行采集,通过数据预处理将其整理成统一数据格式(json或xml等)存储在数据库中,为基础计算层提供数据支持。
(2)基础计算层
基础计算层主要包括两类计算:
一是应激事件计算。应激事件计算是对学生发布在社交媒体中的文本进行分析,识别学生所表达的相关应激事件。Holmes等(1967)编制的LCU(Life Change Units)量表将应激事件分为43种基本类型;张明圆等(1987)结合LCU量表研究了不同生活事件对中国人的影响,进一步提出了LEU(Life Events Units)量表,该量表将生活事件分为65种类型,并分别给出了青年、中年、更年以及老年四个年龄阶段的LEU值。大学生处于青年时期,因此,本研究结合LEU量表的青年组数据,从中选择出了15个高校学生目前较可能面临的应激事件,分别为:父母死亡、父母离婚、开除、家属重病、失恋、突出成就荣誉、重病外伤、开始恋爱、行政纪律处分、升学就学受挫、入党入团、退学、留级、入学或就业困难以及学习困难。本研究采用词典法进行应激事件计算,首先依据心理学的相关研究,将学生在社交媒体中的文本表述方式(词语、语境)和应激事件对应起来,以构建学生应激事件词典。为了提升词典准确率和构建效率,本研究首先通过人工手段筛选出与应激事件直接相关联的词汇,其次采用腾讯AI实验室构建的词向量模型(Yan et al.,2018)识别与人工提取词汇具有相似含义的其他词汇,最后人工剔除不符合要求的词汇,结果如表1所示。在实际计算中,如果微博文本中含有该词典中某个词语,则认为该文本表达出相应的应激事件。以学习困难为例,词典中对应的词语和微博文本示例如表2所示。
二是人格计算。多项研究发现,人格会影响用户在社交媒体中的行为模式(Ross et al.,2009;Back et al.,2010)。因此通过对社交媒体中用户数据的采集和计算,可以分析出大学生的人格类型。利用深度学习方法,通过对学生在社交媒体中的各项数据的综合分析,可以计算出学生的人格特征。当前在中文社交媒体中基于“大五”人格模型进行的人格计算已有相关研究,本研究采用Wei等(2017)提出的HIE(Heterogeneous Information Ensemble)处理框架进行人格计算,该框架以“大五”人格为标准,基于微博文本、用户头像、表情以及交互形式等多维数据,通过深度学习方法,提取出不同特征的语义信息,随后基于堆叠泛化方法对来自不同特征的语义信息进行集成,最后形成一个人格类型的预测结果。
(3)情绪计算层
在总结前人研究的基础上,本研究提出了基于人格和应激事件的情绪计算算法,该算法的核心思想在于:首先,基于人格计算和应激事件计算得出某时刻学生各种情绪类型所分别对应的情绪强度值;其次,根据学生的人格特质估算出其正向和负向情绪表现的阈值;最后,判断各种情绪的情绪强度是否超出相应阈值,以此来判断该学生表达出了哪些或哪项情绪。该算法中,情绪类型采用Ekman等(1971)的情緒分类方法,将情绪分为厌恶、愤怒、惊奇、恐惧、高兴和悲伤6种类型,其中厌恶、愤怒、恐惧、悲伤为负向情绪,惊奇、高兴为正向情绪。
情绪强度计算。情绪强度是指人对事物所产生的选择倾向性(邢云菲等,2018),结合人格计算和应激事件计算的结果,可以计算出某时刻学生6种情绪类型分别对应的情绪强度值。情绪强度值分布在[-1,1]区间,其中正向情绪分布在[0,1]区间,负向情绪分布在[-1,0)区间。
情绪阈值估算。Izard等(1993)的研究表明,每个人都存在情绪激活阈值,当情绪强度超过该阈值时,个体的情绪便可表现出来。对于情绪阈值的计算,已有研究大多设定为某一常数值。本研究创新性地提出根据学生的人格特质估算出其正向和负向情绪表现的阈值,并根据情绪强度是否超出该阈值来判断该学生是否将某项情绪表达出来。因此,对各种情绪类型的强度计算,是判断学生是否表达该类情绪的重要依据。
(4)危机预警层
本研究采用对情绪持续观测的方式,根据时间序列上的变化来判断有无心理危机的风险。研究主要通过观测来发现以下两种情况:一是情绪的剧烈变化,即短时间内从正向情绪变为负向情绪或由负向情绪变为正向情绪;二是负向情绪持续过久。因此,本研究提出了考虑预警值和持续时间的双监测方法,来判断学生的危机风险水平。结合连续时间序列上各种类型情绪的变化过程(如“愤怒”情绪持续表达)或者相邻时间内情绪强度变化(从正向情绪跌落至极度负向情绪)计算出相应处于[0,1]区间的预警值,并以五级预警信号体系可视化呈现出来,如表3所示,越靠近1,表示危险程度越高。由于大学生微博行为(如发帖等)的频次会对情绪剧烈变化和负向情绪持续时间的计算产生影响,因此,本研究规定时间序列的间隔以天为单位,如果学习者一天内的发帖次数超过两次,则分别以情绪值最大值作为当天的正负情绪值。
四、算法设计
本研究结合心理学领域知识以及机器学习算法进行建模分析,可以规避单纯使用机器学习算法存在的概率问题。在总结前人研究以及情绪心理学理论基础上,改进了情绪预测算法并提出一种情绪阈值估算方法。算法结构如图3所示。
以矩阵E表示情绪类型,E=[edis,eang,esur,efea,ejoy,esad],分别表示厌恶、愤怒、惊奇、恐惧、高兴以及悲伤6种情绪。L表示应激事件对不同情绪的刺激大小,L=[l1,l2…,lk],表示应激事件对k个情绪的刺激强度。令矩阵P表示人格类型,P=[po,pc,pe,pa,pn],分别表示开放型、谨慎型、外倾型、宜人型以及神经质型的空间分布位置。如人格空间为P=[0.8,0.2,0.7,0.5,0]的学生具有开放型人格,面对困难时能以乐观的心态克服困难。令It表示t时刻情感强度的集合,It=[iedis,t,ieang,t,iesur,t,iefea,t,iejoy,t,iesad,t],分别表示厌恶、愤怒、惊奇、恐惧、愉悦以及悲伤6种情绪在t时刻的情绪强度。令Ω为情绪阈值矩阵,Ω=[ωpos,ωneg],其中ωpos表示正向情绪的阈值,ωneg表示负向情绪的阈值。
Ψ()表示情绪衰减函数,Θ()表示应激事件影响函数,Φ()表示人格影响函数,f()表示情绪计算函数,g()表示预警函数。Iei,t表示t时刻第i个情绪的情绪强度值,衰减函数Ψ()与t-1时刻第i个情绪的情绪强度值Iei,t-1有关;应激事件影响函数Θ()与t时刻个体所遭受的应激事件刺激大小L有关;人格影响函数Φ()表示人格因素对情绪强度的影响分量,由于个体的人格较为稳定(伯格,2010),通常是常量,因此,本文假设在一段时间内人格对情绪造成的影响是一组恒定的向量值;情绪计算函数f()综合t时刻的情绪强度Iei,t与情绪阈值,判定某项情绪是否被激活。心理危机预警函数g(Ei,t)则是根据计算出的各类型情绪强度值和时间序列值,计算出学生心理危机等级。
1.情绪衰减函数
情绪心理学研究表明,情绪强度是一个随时间变化的量,根据情绪强度第三定律(情绪强度衰减定律)(仇德辉,2001),情绪强度衰减实际上和指数函数y=e-λ相似,即情绪强度随时间会衰减。当在t时刻时,情绪强度受t-1时刻的影响,λ称为衰减因子,λ越大,情绪强度衰减越快。因此,情绪衰减函数可定义为Ψ(Ien,t)=Ien,t-1e-λ,其中,n={dis,ang,sur,fea,joy,sad}。
2.应激事件影响函数
应激事件是情绪产生变化的直接因素,因此
Θ(Lk,Ien,t)=[Lk,Iedis,t,Lk,Ieang,t,Lk,Iesur,t,Lk,Iefea,t,Lk,Iejoy,t,Lk,Iesad,t],其中,Lk,Ien,t表示第k个应激事件对第n个情绪的影响量。
3.人格影响函数
一个人的人格是相对稳定的,因此,在一段时间内,由人格对情绪产生的影响可以认为是一个确定的分量。研究表明,由人格很难直接推断其对情绪的影响。为了构建人格与情绪之间的关系,2002年有学者提出了一种“性格—心情—情绪—表情”模型(Kshirsagar,2002),随后Gebhard提出了“人格—心情—情绪”模型(Gebhard,2005),该模型率先引入PAD三维心情空间作为人格与情绪的中介,心情空间通过愉悦度(Pleasure)、唤醒度(Arousal)以及支配度(Dominance)三个维度进行度量(Mehrabian,1996),国内也有学者在这方面进行了探索(郭尚波,2008;陈伟,2011)。
为了计算人格与心情之间关系,引入“人格—心情”映射矩阵K,以及心情空间矩阵M。人格—心情转移方程为M=P×KT,其中K采用Gebhard的处理方法(Gebhard,2005)。
为了计算心情与情绪之间的关系,引入“心情—情绪”转移矩阵F以及24维度情绪空间矩阵O。心情—情绪转移方程为O=M×F,其中F采用与Gebhard的研究相同的处理办法(Gebhard,2005)。
将上述24维度基本情绪映射成Ekman提出的6维度基本情绪,计算方法如下。
Ip,dis=ODisgust
Ip,ang=(OAnger+OReproach+OHate)×1/3
Ip,sur=OSurprise
Ip,fea=(OFear+OFearsConfirmed)×1/2
Ip,joy=OHappyFor+OGloating+OJoy+OPride+OAdmiration+
OLiking+OLove+OHope+OSatisfaction+ORelief+
OGratification+OGratitude)×1/12
Ip,sad=(OResentment+OPity+ODistress+OShame+ORemorse)
×1/5
因此,人格对情绪影响的函数如下式。
Φ(P)=[Ip,dis,Ip,ang,Ip,sur,Ip,fea,Ip,joy,Ip,sad]
4.情緒计算函数
(1)情绪强度函数
t时刻的情绪强度函数可以表示为:
Ien,t=Ψ(Ien,t-1)+Θ(L)+Φ(P)
即t时刻的情绪强度是上一时刻(t-1)情绪强度的衰减值和应激事件对情绪影响以及人格因素对情绪变化影响的总和。
(2)阈值估算函数
当前大部分研究是将情绪阈值设置为某一常数值,如张刚强等人将正向和负向情绪阈值分别设置为0.8和0.21(张刚强等,2018);邵帅等人将正向和负向情绪阈值分别设定为0.16和-0.12(邵帅等,2018)。也有研究者将情绪阈值与人格定义为线性函数关系,如伍京华等人提出的情绪阈值计算函数为:m=|Oo-On|/10,其中Oo表示开放型人格,On表示神经质型人格(伍京华等,2020)。但是,在实际生活中,不同人在面对相同应激事件时所表现出的反应大不相同。因此,以简单的定值或者线性关系进行情绪阈值的估计有着较大的局限性。为了更加准确地估计每个人的情绪阈值,本研究以Watson等(1984;1992)的研究为基础,提出一种新的情绪阈值估算方法。Watson等人的研究表明责任心(C)以及外倾性(E)两种人格对正向情绪具有显著影响;神经质(N)人格对负向情绪具有显著影响。
根据Izard(1977)的理论,一个人某项情绪阈值越小,其越容易表现出该情绪,如当一个人悲伤情绪的阈值较低时,往往一件小事就会引发其强烈的悲伤情绪。由此,本研究假设阈值仅与谨慎型、外倾型以及神经质型三种人格有关,令ξ表示影响正向情绪的人格(C、E)与影响负向情绪的人格(N)的差值,即:ξ=pc+pe-pn;令ω为情绪阈值,情绪阈值与ξ密切相关。ξ值越大则表示该学习者的正向人格大于负向人格,负向情绪阈值也就越大,正向情绪阈值越小,其越容易表现出正向情绪,难以表现出负向情绪。Kingdom等(2016)提到,心理物理学领域通过一系列实验构建了一个通用的转换函数,用以描述物理刺激量和主观内部反应之间的关系,如图4所示。随着刺激差值增加,个体内部感觉增加程度也会变得越来越慢。
据此,本研究假设情绪阈值与ξ间也存在类似的关系,用函数Ω表示,其中ωneg表示负向情绪阈值,ωpos表示正向情绪阈值。同时考虑到人格差值ξ存在负值,于是提出以arctan()函数来刻画这种关系,而函数中加π/2与除以π则是为了将估算结果缩放至[0,1]区间。
该估算方法函数仿真图像如图5所示,可以看出,ξ越大负性情绪阈值越大,表明负性情绪越难被激活,同时其增长速率越来越缓慢。
(3)情绪计算函数
根据情绪强度函数得出的情感强度值,其与基于人格计算出的情绪阈值作比较,如果超过阈值,则认为该情感被表达出来,反之不被表达。为了计算方便,将高兴和惊奇两种情绪强度规定为正向情绪,即:Ipos=[iejoy,t,iesur,t],将厌恶、悲愤、恐惧和悲伤规定为负性情绪,即:Ineg=[iedis,t,ieang,t,iefea,t,iesad,t],给出t时刻情绪计算方程如下。
5.心理危机预警函数
根据本研究构建的理论模型,需要对情绪的强度变化以及情绪持续时间进行统计。如果情绪强度变化超出一定的范围,则将认为是一种剧烈变化,有可能引起学生的心理危机状态,如由强度为0.8的正向情绪(Ipos=0.8)变为强度为-0.8的负向情绪(Ineg=-0.8)。同时,如果负向情绪持续时间过长,如持续时间超过3天,也容易导致学生进入心理危机状态。因此,本研究提出一种心理危机预警算法,该算法输入分别为6种情感的差值△I或负性情感的时间差值△T;其中△I=|Ineg|-Ipos。本研究采用Logistic函数作为预警算法,如下式。
五、仿真实验
仿真是在进入真实实验之前进行的计算机模拟方法。本研究使用的仿真机器操作系统为Windows 10,CPU型号为i5-11400H;仿真程序采用Python编写,软件包为Numpy。为了进行仿真实验,本研究随机设定开放型人格的人格空间为Po=[0.8,0.2,0.6,0.4,0],神经质型人格的人格空间为Pn=[0,0.6,0.1,0.1,0.9],同时,随机设定正向刺激分量Lwpos=[0.2,0.1,0.3,0.1,0.7,0.3],负向刺激分量Lweng=[-0.5,-0.7,-0.1,-0.4,-0.5,-0.6],进而分别模拟了开放型人格和神经质型人格在遭受单次与多次正向和负向刺激时的情绪变化。其中,正向情绪强度越趋近于1说明其强度越强,越趋近于0则强度越弱;负向情绪越趋近于-1表明其强度越强,越趋近于0则强度越弱。正向情绪强度值高于正向情绪阈值则表示该情绪被激活,负向情绪强度值低于负向情绪阈值表示该情绪被激活。在此需要特别说明的是,L表示应激事件对不同情绪的刺激大小,这需要大量数据来验证,后续将进一步研究L的计算,在此不作详细讨论。
1.单次刺激
(1)单次正向刺激
图6为开放型人格在单次正向刺激下的情绪变化过程,在t=3时刻遭受到正向刺激时先是正向情绪强度增强,负向情绪强度减弱,随着时间增加,正向和负向情绪都逐渐衰减。其中,正向情绪被激活,先是表现出“愉悦”和“惊奇”的情绪,衰减后依然表现出“愉悦”的情绪,而“惊奇”的情绪则不再表现出来,整个过程中负向情绪始终都没有被激活。
图6 开放型人格遭受单次正向应激事件刺激的情绪变化过程
图7为神经质型人格在单次正向刺激下的情绪变化过程,在t=3时刻遭受到正向刺激时先是正向情绪强度增强,负向情绪强度减弱,随着时间增加,正向和负向情绪都逐渐衰减。其中,先是正向的“愉悦”和“惊奇”情绪被激活,这两种正向情绪在遭受刺激初期强度都有所增强,随着时间推移出现衰减,随后衰减至正向情绪阈值以下,不再表现出来。而负向情绪在遭受刺激初期没有被激活,随着时间推移,“恐惧”的情绪突破负向情绪激活阈值表现出来。
图7神经质型人格遭受单次正向应激事件刺激的情绪变化过程
(2)单次负向刺激
图8表示的是开放型人格在t=3时刻遭受单次负向刺激时表现出的情绪变化过程,先是正向情绪表现出来,并且强度逐渐减弱,跌落至正向情绪激活阈值以下,同时负向情绪强度逐渐增强,在t=5时刻突破阈值表现出来。随着时间推移,正向情绪强度又逐漸增强。t=6时刻,“愉悦”情绪逐渐高于阈值表现出来,而负向情绪强度则逐渐减弱不再表现出来。
图8 开放型人格遭受单次负向应激事件刺激的情绪变化过程
图9表示神经质型人格在t=3时刻遭受单次负向刺激时表现出的情绪变化过程,正向情绪先是强度减弱,后有所增加,但是始终处于情绪激活阈值以下,没有被激活。而负向情绪则较快地突破负向情绪激活阈值表现出来,随着时间推移,大部分负向情绪强度逐渐减弱,高于负向情绪阈值而不再表现出来,而“恐惧”情绪则逐渐被激活出来。
图9神经质型人格遭受单次负向应激事件刺激的情绪变化过程
2.多次刺激
在现实生活中,学生经常面临多个应激事件,因此本研究通过仿真的方法,分别模拟开放型人格和神经质型人格遭受到不同情况刺激下的情绪变化过程。
(1)开放型人格多次刺激
图10模拟的是开放型人格在t=3时刻遭受正向刺激,随后t=7时刻又遭受负向刺激时的情绪变化过程。在t=3时刻遭受正向刺激后,正向情绪强度先是逐渐增强,负向情绪强度先是逐渐减弱;随着时间推移,正向情绪强度减弱,负向的“愤怒”和“厌恶”情绪强度呈减弱趋势,而“悲伤”和“恐惧”情绪强度增强。而后t=7时刻遭受负向刺激,正向情绪强度逐渐减弱,负向情绪强度逐渐增强,并突破负向情绪激活阈值而表现出来。随着时间推移,负向情绪强度逐渐减弱,正向情绪强度逐渐增强,“愉悦”情绪强度逐渐大于正向情绪激活阈值表现出来。
(2)神经质型人格多次刺激
图11模拟的是神经质型人格在t=3时刻遭受正向刺激,随后在t=7时刻遭受负向刺激时的情绪变化过程。在t=3时刻遭受正向刺激后,正向情绪强度逐渐增强,负向情绪强度逐渐减弱;随着时间推移,正向情绪强度逐渐减弱至不再表现出来,负向情绪强度呈增强趋势。而后t=7时刻遭受负向刺激,正向情绪强度逐渐减弱,负向情绪强度逐渐增强,并突破负向情绪激活阈值表现出来。随后,正向情绪强度有所增强,但始终低于激活阈值未再被激活,而负向情绪强度逐渐减弱,但是“恐惧”情绪后又突破阈值表现出来。
图11神经质型人格遭受多次应激事件刺激的情绪变化过程
六、总结
本研究以心理学相关理论为依据,分析得出,可以通过对情绪持续观测来预警心理危机,并基于此构建了基于社交媒体大数据的心理危机预警模型,为大学生心理危机预警提供了创新性的观测方法和思路。该模型的核心思想在于,应激事件和人格特质是情绪变化的内外诱因,在进行应激事件计算和人格计算的基础上,可以得出不同类型情绪的情绪强度与情绪阈值,从而判断情绪表现,同时基于时间序列上情绪的变化来判断大学生所面临的心理危机风险水平。结合心理学领域知识和机器学习方法,本研究在改进情绪预测算法的基础上,提出了基于社交媒体大数据的心理危机预警算法,该算法通过计算人格、应激事件的影响并结合情绪计算和衰减来预测情绪持续时间及强度,有效规避了单纯使用机器学习算法所存在的概率问题。仿真实验表明,该算法可以反映出大学生在遭受应激事件时的情绪变化过程,从而初步验证了算法的有效性。
尽管本研究所构建的模型和算法基于一定的心理学理论,但是心理危机涉及心理学、医学、社会学、哲学等学科领域,只有进一步融合多学科领域才能更好地揭示心理危机的本质。同时,模型和算法的检验也需要长期的数据跟踪。本研究提出的算法在真实应用中可能面临如下问题有待后续研究加以解决。第一,大学生可能不经常通过某种社交媒体(如微博)来表达自己的情感,当遇到这种情况时需要扩大对不同社交媒体的采集范围,尽可能多地采集学生信息。精准的心理危机预警不是仅靠社交媒体大数据来实现的,需要对多源异构数据进行整合,比如当前大学生所使用的社交媒体除微博外,还包括百度贴吧、知乎、小红书、绿洲等;同时学生成绩、家庭情况等存储在学校信息管理系统中的信息也是非常重要的数据源。如何将学生在不同社交媒体中的数据和在不同信息系统中的数据进行集成,综合多特征数据进行心理危机预警,是后续研究需关注的重点。第二,学生在博文中描述应激事件的词汇不存在于词典中,会导致应激事件不能被准确识别出来。解决此类问题主要依赖当前分词软件中对未登录词的识别功能,以目前主流的“结巴分词”软件为例,该软件通过隐马尔可夫算法(Hidden Markov Model,HMM)识别出当前语句中尚不在应激事件词典中的词语,并自动提醒分析人员进行人工识别,如果确定是描述某一应激事件的新词,则手动添加到词典中。随着词典的不断完善,应激事件识别的准确率也会越来越高。第三,本研究提出的心理危机预警算法在实际应用中不可避免地会涉及学生个人账号等隐私信息,如何保护好学生的隐私数据也是未来研究需要关注的重点问题。
参考文献:
[1][美]伯格(2010).人格心理学[M].陈会昌.北京:中国轻工业出版社.
[2]白朔天,郝碧波,李昂等(2014).微博用户的抑郁和焦慮预测[J].中国科学院大学学报,31(6):814-820.
[3]陈伟(2011).情感智能体认知行为建模研究[D].长沙:国防科学技术大学.
[4]郭尚波(2008).个性化情感建模方法的研究[D].太原:太原理工大学.
[5]黄中海(2015).数据挖掘在高校学生心理危机预防中的应用[D].武汉:武汉科技大学.
[6]姜乾金(2010).医学心理学(第2版)[M].北京:人民卫生出版社.
[7]姜土生,邓卓明(2013).大学生心理危机类型分析[J].当代青年研究,(2):97-102.
[8]李祚,张开荆(2012).心理危机干预[M].大连:大连理工大学出版社.
[9]梁娟,罗海据(2018).大数据挖掘方法在大学生心理预警系统中的应用[J].中国学校卫生,39(12):1821-1824.
[10]鲁玮(2019).数据挖掘技术在高职学生心理健康数据中的应用研究[D].合肥:安徽大学.
[11]钱春霞,顾玮玮(2015).大学生心理档案信息化建设研究[J].档案与建设,(4):34-37.
[12]邱鸿钟(2009).应激与心理危机干预[M].广州:暨南大学出版社.
[13]邱亚飞,魏荣霞,邱吟(2020).健康中国背景下大学生心理普查工作探新[J].高教学刊,(27):57-60.
[14]仇德辉(2001).数理情感学[M].长沙:湖南大学出版社.
[15]邵帅,刘学军,李斌(2018).基于关键句分析的微博情感倾向性研究[J].计算机应用研究,35(4):982-987.
[16]田玮,朱廷劭(2018).基于深度学习的微博用户自杀风险预测[J].中国科学院大学学报,35(1):131-136.
[17]伍京华,王竞陶,刘浩等(2020).基于Agent的情感映射的劝说模型及系统[J].计算机集成制造系统,26(4):1081-1096.
[18]邢云菲,王晰巍,韦雅楠等(2018).新媒体环境下网络舆情用户情感演化模型研究——基于情感极性及情感强度理论[J].情报科学,36(8):142-148.
[19]杨芳,黄智生,杨冰香等(2019).基于人工智能技术的微博“树洞”用户自杀意念分析[J].护理学杂志,34(24):42-45.
[20]曾红(2012).应急与危机心理干预[M].北京:人民卫生出版社.
[21]张刚强,刘群,纪良浩(2018).基于序贯三支决策的多粒度情感分类方法[J].计算机科学,45(12):153-159.
[22]张明园,樊彬,蔡国钧等(1987).生活事件量表:常模结果[J].中国神经精神疾病杂志,(2):70-73.
[23]中国互联网络信息中心(2017).2016年中国社交应用用户行为研究报告[EB/OL].[2019-08-01].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/sqbg/201712/P020180103485975797840.pdf.
[24]庄婷婷,李冬梅,檀稳等(2019).基于分层支持向量机的微博用户自杀倾向预测与分析[J].哈尔滨工程大学学报,40(11):1890-1895.
[25]Back, M. D., Stopfer, J. M., & Vazire, S. et al. (2010). Facebook Profiles Reflect Actual Personality, Not Self-Idealization[J]. Psychological Science, 21(3):372-374.
[26]Beck, A. T., Kovacs, M., & Weissman, A. (1979). Assessment of Suicidal Intention: The Scale for Suicide Ideation[J]. Journal of Consulting and Clinical Psychology, 47(2):343-352.
[27]Beck, A. T., Ward, C. H., & Mendelson, M. et al. (1961).An Inventory for Measuring Depression[J]. Archives of General Psychiatry, 4(6):561-571.
[28]Corr, P. J., & Matthews, G. (2009). The Cambridge Handbook of Personality Psychology[M]. New York: Cambridge University Press.
[29]Cull, J. G., & Gill, W. S. (1982). Suicide Probability Scale (SPS) Manual[M]. Los Angeles: Western Psychological Services.
[30]Ekman, P., & Friesen, W. V. (1971). Constants Across Cultures in the Face and Emotion[J]. Journal of Personality and Social Psychology, 17(2):124-129.
[31]Gebhard, P. (2005). ALMA: A Layered Model of Affect[C]// Proceedings of the 4th International Joint Conference on Autonomous Agents and Multiagent Systems. New York: Association for Computing Machinery:29-36.
[32]Hamilton, M. (1959). The Assessment of Anxiety States by Rating[J]. British Journal of Medical Psychology, 32(1):50-55.
[33]Hamiton, M. (1960). A Rating Scale for Depression[J]. Journal of Neurology, Neurosurgery and Psychiatry, 23(1):56-62.
[34]Holmes, T. H., & Rahe, R. H. (1967). The Social Readjustment Rating Scale[J]. Journal of Psychosomatic Research, 11(2):213-218.
[35]Izard, C. (1977). Human Emotions[M]. New York: Plenum Press.
[36]Izard, C. E., Libero, D. Z., & Putnam, P. et al. (1993). Stability of Emotion Experiences and Their Relations to Traits of Personality[J]. Journal of Personality and Social Psychology, 64(5):847-860.
[37]Kingdom, F., & Prins, N. (2016). Psychometric Functions[J]. Psychophysics, (12):55-117.
[38]Kshirsagar, S. (2002). A Multi-Layer Personality Model[C]// Proceedings of the 2nd International Symposium on Smart Graphics. New York: Association for Computing Machinery:107-115.
[39]Lazarus, R. S., & Folkman, S. (1984). Stress, Appraisal, and Coping[M]. New York: Springer.
[40]Lucas, R. E., & Diener, E. (2001). Understanding ExtravertsEnjoyment of Social Situations: The Importance of Pleasantness[J]. Journal of Personality and Social Psychology, 81(2):343-356.
[41]Martin, R., Watson, D., & Wan, C. K. (2000). A Three-Factor Model of Trait Anger: Dimensions of Affect, Behavior, and Cognition[J]. Journal of Personality, 68(5):869-897.
[42]Mehrabian, A. (1996). Analysis of the Big-Five Personality Factors in Terms of the PAD Temperament Model[J]. Australian Journal of Psychology, 48(2):86-92.
[43]Miwa, H., Umetsu, T., & Takanishi, A. (2001). Robot Personality Based on the Equations of Emotion Defined in the 3D Mental Space[C]// Proceedings of the 2001 International Conference on Robotics and Automation. Washington: IEEE Computer Society:2602-2607.
[44]Reynolds, W. M. (1991). Psychometric Characteristics of the Adult Suicidal Ideation Questionnaire in College Students[J]. Journal of Personality Assessment, 56(2):289-307.
[45]Ross, C., Orr, E. S., & Sisic, M. et al. (2009). Personality and Motivations Associated with Facebook Use[J]. Computers in Human Behavior, 25(2):578-586.
[46]Song, Y., Shi, J., & Zhang, H. (2018). Directional Skip-Gram: Explicitly Distinguishing Left and Right Context for Word Embeddings[C]// Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Louisiana: Association for Computational Linguistics.
[47]Spielberger, C. D., Gorsuch, R. L., &Lushene, R. E. (1970).Manual for the State-Trait Anxiety Inventory (Form Y)[M]. Palo Alto: Consulting Psychologists Press.
[48]Watson, D., & Clark, L. A. (1984). Negative Affectivity: The Disposition to Experience Aversive Emotional States[J]. Psychological Bulletin, 96(3):465-490.
[49]Watson, D., & Clark, L. A. (1992). On Traits and Temperament: General and Specific Factors of Emotional Experience and Their Relation to the Five-Factor Model[J]. Journal of Personality, 60(2):441-476.
[50]Wei, H. H., Zhang, F. Z., & Yuan, N. J. et al. (2017). Beyond the Words: Predicting User Personality from Heterogeneous Information[C]// Proceedings of the 10th ACM International Conference on Web Search and Data Mining. New York: Association for Computing Machinery:305-314.
[51]Zelenski, J. M., & Larsen, R. J. (1999). Susceptibility to Affect: A Comparison of Three Personality Taxonomies [J]. Journal of personality, 67(5):761-791.
[52]Zung, W. W. (1971). A Rating Instrument for Anxiety Disorders[J]. Psychosomatics, 12(6):371-379.
收稿日期 2021-03-11責任编辑 杨锐
An Early Warning Method for Psychological Crisis of College Students Based on
Social Media Big Data
LI Tongtong, LI Tan, GUO Xuning
Abstract: Vicious incidents such as suicides and crimes of college students caused by psychological problems are increasing year by year, and college students psychological crisis has become the social focus. Early warning of psychological crisis is a key process in mental health education. However, current widely adopted methods of psychological crisis screening are based on clinical diagnostic scales, which have problems such as large measurement errors, low efficiency, poor timelines, and etc. Social media big data provides an opportunity for real-time and accurate screening of college students psychological crisis. The psychological research shows that psychological crisis can be forewarned through emotion changes. The college students psychological crisis forewarning model and its algorithm are given in this paper. In the model, firstly, the calculation of stress events and personality are calculated based on Micro-blog data, then the emotion performance is judged through analyzing the intensity and threshold of different types of emotions, and then the risk level of psychological crisis will be measured based on the changes of emotions by time. The simulation results show that the method can reflect the emotional change process of college students when they suffer from stress events, and can provide effective forewarning of their psychological crisis.
Keywords: Mental Health Education; Psychological Crisis Forewarning; Social Media Big Data; Stress Events; Personality