基于数据挖掘与智能计算的情感数据分析与心理预警系统研究
2021-06-16赵丁
赵丁
(石家庄工程职业学院,河北石家庄,050000)
0 引言
近年来,人们的生活水平得到了显著提高,与此同时,较快的生活节奏使得一些人在日常生活及交际过程中也出现了不同程度的心理问题,据相关数据表明,在我国青年群体中,有将近30%的青年处于心理健康不佳的状态,而在这些青年群体中,又有高达10%至12%的青年从心理健康不佳状态发展到抑郁症状态,更有甚者曾经产生过自杀的想法。为了解决人们在生活中产生的心理问题,我国便需要建立心理健康预警系统。考虑到人们的心理数据采集与分析是比较困难的,而且存在时效性差和预警不及时等问题,因此在建立心理健康预警系统过程中需借助于现代化技术手段,将数据挖掘技术作为系统中的基础性技术,并利用人工智能技术来分析面部数据,以此对被检测对象的心理状态及情绪波动进行检测,进而做出及时准确的预警。
1 情感数据分析与心理预警系统的结构分析
在基于数据挖掘与智能计算的情感数据分析与心理预警系统中,其主要有三大组成部分,分别是情感数据分析部分、采集被测数据部分和心理预警部分。以往的情感数据分析及心理预警系统存在实效性差、设计误差较大等不足,为了弥补这些不足,便需要围绕监测对象来采集大量的网络数据样本,以便于对被监测对象的情绪波动及心理状态等数据进行主动性的采集,通过对被监测人员的面部信息进行检测,然后利用情感数据分析部分来判断其情绪波动和心理状况,当被监测人员出现较大的情绪波动或心理状况异常时,预警系统便会及时发出预警。
2 人类表情数据的采集
■2.1 人类表情介绍
人类对情绪的表达是通过面部活动来实现的,而这种面部活动便是所谓的表情,通过表情可以了解人类的情绪指标。对于表情来说,其主要是由人的五官和面部肌肉进行不同组合而形成的,这也使其成为人们在进行交流时用于表达情绪的重要方式。在人所产生的各种表情中,大致可将常见表情分为六种,分别是高兴、讨厌、恐惧、悲伤、惊讶和愤怒,除此之外,多种表情还可进行相应的复合,从而产生更加复杂的表情,例如悲愤便是悲伤和愤怒进行复合而产生的表情。在心理健康治疗领域,为了更好的解决患者的心理精神疾病,就必须要对患者的表情变化及心理波动有所掌握,而这便要应用到面部表情识别技术,该技术优越性也正日益显现出来。
■2.2 面部表情识别
近年来,越来越多的人开始意识到面部表情识别技术的应用价值,该技术也在短短的几十年里取得了快速发展。一直以来,人们在应用面部表情识别技术时,往往需要对人脸图像进行去噪处理,然后对图像中的人脸轮廓、断点等特征进行提取,以便于根据图像中人脸的表情特征来分析其心情,然后作出相应的分类,不过,这种技术方法只是较为浅层的学习方法,这是因为人们对人脸表情特征的提取是较为困难的,而且提取的数据量也非常大,这也使人们迫切需要优化面部表情识别技术的应用稳定性。相比于以往的基于特征提取的面部表情识别算法来说,以深度学习为核心的面部表情识别技术能够更好的提取图像中的人脸特征,深度学习是通过大量的学习来掌握图像中人脸特征的提取方法,通过结合特征工程和深度学习网络预测,能够大大简化提取图像中人脸特征的流程,从而缩短特征提取时间,节约大量的人工成本。
在对人类的面部表情进行分析时,需要掌握其阴影变化和面部肌肉形态所产生的不同组合形式,所以需要对人类面部表情单位在各个区域中所具有的特征进行相应的定义,具体的定义公式可表述为:
3 基于数据挖掘与智能计算的情感数据分析及心理预警系统研究
在本文中所设计的情感数据分析与心理预警系统需要进行深度学习,但由于较少的数据集样本以及数据集类内变化会影响深度学习网络等原因,因此在设计情感数据分析及心理预警系统时需要通过神经网络来解决上述问题。
■3.1 神经网络
以抽象角度来说,神经网络是一种类似于人体中神经元分布结构的网络,人们又将这种网络称之为人工神经网络,人工神经网络从本质上来说是一种连接模型,其能够对动物神经网络的行为特征进行模仿,以便于采取分布式并行方式来处理信息,在此过程中,神经网络需要对其内部大量节点的相互连接关系进行调整,以此达到信息处理目的。在神经网络中,需要对实际输出和理想输出的差值进行计算,然后利用极小化误差法来对全矩阵进行优化。在利用神经网络进行训练时,具体的实施流程如下:第一步是对人脸数据集进行选定,对相应的权值进行优化,0的附近必须存在绝对值;第二步是在训练机中筛选出照片样本;第三步是对目标输出向量和实际输出向量的差值,也就是两者的误差进行计算;第四步是对隐含层节点的误差进行计算;第五步是对权值阈值变化范围进行计算;第六步是对权值及阈值进行调整,并判断精度能否满足约束条件中的精度要求;第七步是利用反向学习算法来对神经网络中的权值系数进行更新,如果满足训练精度要求,便可对BP神经网络中的阈值及权值进行保存,此时神经网络的训练流程正式结束。
■3.2 多源数据库
在基于数据挖掘与智能计算的情感数据分析与心理预警系统中,由于算法设计会受到系统反馈图像拍摄条件的不同而产生类内差异,而类内差异则会严重影响到神经网络的训练结果,因此为了确保BP神经网络在应用过程中能够具有较好的鲁棒性,使其获得准确的训练结果,便需要对多源数据库进行选取。利用多元数据库中存储的样本来进行BP神经网络训练,能够大大丰富人脸的面部图片,从而极大降低AU及AU强度和样本所存在的关联性。并且,对样本数据的获取途径进行合理的选择,还能避免在筛选图片过程中受到人为因素的主观性干扰。
■3.3 心理预警系统
通过在基于数据挖掘与智能计算的情感数据分析与心理预警系统中对BP神经网络数据库进行架构,并以此为基础,使该系统不再使用以往的Windows操作系统,而是采用机器人操作系统来进行代替,该系统的英文全称为ROS Robot Operation System,也就是所谓的ROS系统。在应用ROS系统的基础上,为了实现对被监测对象面部数据的获取,还要在系统硬件设备中安装相机摄像头,该相机摄像头为Kinect 2.0 RGBD,具体配置如下:Kinect 2.0 RGBD相机的RGB分辨率为1024×768,深度分辨率为512×424,检测人数为6人,检测范围为0.5~4.5m,检测角度为70度。通过建立心理预警系统,如果被检测对象在监测过程中的心理状况出现异常波动,系统便可结合以往的检测心理病例来做出综合性的分析,在被检测对象的电子终端中借助于UDP通讯协议进行预警,并提供必要的帮助信息。
4 基于数据挖掘与智能计算的情感数据分析与心理预警系统验证
■4.1 稳定性验证
对于Kinect摄像头所采集的图片流来说,需要利用OpenCV库来进行相应的预处理,然后借助于上文中设计的情绪分析系统来深度分析被测对象在心理及情绪方面的波动情况,然后通过多元数据库来检验稳定性。在对多源性数据库进行应用过程中,为了对测试算法是否稳定进行验证,还必须要设置一种验证方法。该方法具体如下:首先采取随机的方式对数据库进行选择,选择数量为两个,然后利用网络来进行训练,而采用的验证数据集则必须具有独立性。实验方式共计有三种,一种是得出单次训练的结果以及平均值,另一种则是采取相同留一验证条件来获得训练结果,以此验证训练结果是否接近或相同。最后一种则是以动作组合强度来估计平均误差。考虑到不同数据集在拍摄过程中都或多或少的存在不同差异,而且不同数据库中存储的图像所具有的类内差别也比较高。
■4.2 心理预警实时性验证
为了验证本文所提出的系统在发出心理预警时是否准确、及时,需要对四组匿名人群进行随机性的抽取,然后采用ROS和Ubuntu这两种操作系统来对心理预警系统进行搭建,以便于对上述四组匿名的人群进行心理状态识别,以此区分出这四组匿名人群中,哪个组的人群属于正常人,哪个组的人群属于抑郁症人群,哪个组的人群属于焦虑症人群。在利用心理预警系统进行检验时,还要和人群的真实数据进行结果对比,以此分析心理预警系统的识别结果是否正确。具体的对比结果如图1所示,并由此能够充分体现出心理预警系统是否有效。
图1 心理预警系统的有效性验证结果
通过观察图1中的识别结果可以了解到,本文所构建的心理预警系统能够成功识别出患有焦虑症,也就是心情处于烦躁、郁闷状态的躁郁人群,究其原因在于这类人群在患有焦虑症以后,其表情变化会产生比较明显的非正常特征,而对于正常人群的识别则是最高的。
5 结语
综上所述,本文中构建系统所采集的情感数据是通过数据挖掘算法和神经网络得到的WorldNet面部数据,根据这些情感数据,系统便可对被测者的情绪波动情况及心理状况做出准确、实时的判断,进而及时发出心理预警。通过该系统的设计,可有效弥补传统心理预警系统所存在的不足,提高心理状况检测结果的准确度和可信度,并进一步缩短数据的采样周期,可节约大量的人力成本。