基于GA+BP模型的大学生心理健康自动评级方法研究

2022-12-13陈永涌胡永康

教育观察 2022年32期

徐洁，陈永涌，2 ，胡永康

(1.青海师范大学教育学院，青海西宁，810016；2.青海师范大学高原科学与可持续发展研究院，青海西宁，810016；3.中国农业大学信息与电气工程学院，北京，100083)

一、引言

2019年，健康中国行动推进委员会发布了《健康中国行动(2019—2030年)》，指出要以健康为中心，充分利用互联网技术，建立完善的心理防治服务链，力求高效掌握健康状态，及时提供干预和指导，希冀提升人民群众生活的幸福感和满意度，追求身心的共同健康。[1]大学生是国家和民族的青年一代，其是否具备健康的身心体魄，既关乎自身的发展与成长，也关乎国家的富强与繁荣。对青少年来说，大学阶段是他们成长过程中从“非独立的人”成长为“独立的人”的重要转折期，他们需要在短时间内学会自理、自制、自觉。难以跳出固定模式的大学新生容易出现各种心理状况，恐惧、抑郁、焦虑等情绪问题是其较为常见的心理健康问题。[2-3]

为预防大学生心理危机事件的发生，提高大学生的心理健康素质，各高校基本会在新生入学后的第一个学期进行心理普查，经过“培训准备—心理测试—数据分析—约谈筛选—心理咨询”五个程序。其中，心理测试和数据分析环节的工作最耗时、耗力。若不能及时筛查出有心理危机的学生，将直接延误心理咨询的最佳时期。因此，时效性和准确性一直是心理健康测评面临的挑战。[4]

在人工智能时代，机器学习引起了人们的关注。通过对大量已有数据的特征学习、数据间联系的分析、网络模型的建立，从而在真实的数据上得到良好的预测效果[5]，使机器学习成为预测界经典统计模型的有力竞争者。BP神经网络是实现机器学习的方式之一，能利用现有的数据找出输入数据与输出数据之间的近似关系并进行仿真，从而根据数据的变化特点做到提前预测。BP算法的运行速度快、自学习能力强，实时处理效率高，在心理健康测评领域展现了很大的发展潜力。然而，BP算法也存在一些局限性，如学习速度慢、训练时间长、稳定性较差等。因此，BP算法常与其他算法结合起来使用，以弥补单个算法的不足。GA算法在宏观搜索和全局优化方面有着良好的表现[6]，GA算法与BP算法相结合在一定程度上可以增强高效的全局优化的能力，提高网络模型的稳定性。对此，本研究利用GA算法对BP神经网络进行优化，使神经网络在检验和分析大学生心理普查的数据方面形成自学能力，解决传统心理健康普查过程中出现的时效性和准确性低的问题，构建基于GA+BP的大学生心理健康自动评级模型。通过对大学生心理健康水平的自动评级，心理健康测评能减少数据分析过程中因主观意志而出现的不确定性，节约传统数据处理的人力资源和时间成本，提高数据筛查的速度和效率，为大学生提供及时的心理援助服务。

二、GA+BP网络模型的概述

(一)BP神经网络

BP神经网络是机器学习算法中一种经典的多层感知机模型，也是一种有监督学习模型和简单的神经网络模型，其模型结构如图1所示。在BP模型结构中，x是输入值，y是输出值，i是输入层神经元，h是隐藏层神经元，o是输出层神经元，w是每两个神经元之间的权重，b是当前神经元的偏置。

BP模型的输出结果采用前向传播，即输入一个样本后，通过计算得到每个神经元的输出值；每个神经元的计算方式相同，输出值都是由其输入的线性组合得到。[7]BP模型可以通过自学习使输出值和真实值尽可能地保持一致，输出值和真实值两者的误差越小，说明结果越好。该算法通过采用梯度下降算法计算误差，并通过反向传播算法反向调整每个神经元的权重和偏置，最终得到模型的最优结果。

(二)GA算法

GA算法即遗传算法，最早是由美国的John Holland于20世纪70年代提出。[8]该算法借鉴了生物演变进化的理念，让数据从初始随机混沌的状态根据一定的规则、进化演变成合理解。经过几次“选择—交叉—变异”的重复操作迭代后，适应度高的个体产生下一代，适应度低的个体被逐步淘汰，这种类似自然界中的优胜劣汰法则的算法便是GA算法。随着计算机能力的发展和实际应用需求的增多，GA算法因其智能寻优能力、自适应能力、并行计算等特点被广泛运用于许多领域，且逐渐进入实际应用阶段。

(三)基于GA+BP网络的模型设计

BP模型存在一定的局限性，如容易陷入局部最优解而得不到全局最优解，训练时间较长、学习效率低、收敛速度慢，隐藏层神经元数目无法通过现有的理论指导确定，学习新样本时会遗忘旧样本等。[9]将BP模型与GA算法结合使用，在一定程度上可以增强模型的整体智能寻优能力和自适应能力，提高网络模型的稳定性，增强高效的全局优化的能力。基于GA+BP网络的模型设计流程如图2所示。

三、基于GA+BP的大学生心理健康自动评级模型的应用

(一)研究对象

本研究以青海某高校2021级大学生为被试，以班级整群抽样的方法，组织学生在多媒体教室扫描问卷星二维码的方式进行数据的收集。本研究总计回收了3401份数据，剔除无效数据304份，实际回收有效数据3097份，有效回收率为91%。在研究对象开始填写问卷前，研究者会用统一的指导语说明本次心理健康调查的目的和意义，告知自愿制度和保密制度，在征得测查对象的同意后组织班级统一施测。

(二)调查工具

1.基本情况调查问卷

本研究采用自编的基本情况问卷，收集该校2021级大学生的基本背景资料，包括被试的学号、性别、年龄、民族、专业等基本内容。基本背景资料的收集主要是方便心理普查后的数据分析，以及对有心理危机学生进行定向追踪。

2.症状自评量表(SCL-90)

本研究采用的症状自评量表，是最著名、应用最广泛的心理健康测量量表之一。[10]该量表共有90个项目，以近一周的实际感受为评分依据，从日常生活、情绪变化到思维意识等方面综合评估个体近期的精神状态。SCL-90每个项目都是5级评分(1=“无”—5=“严重”)，结果可以划分为10个因子，能清晰地显示个人有无心理症状及心理症状的严重程度。本研究中，SCL-90的Cronbach’s α为 0.954。

(三)数据预处理

1.数据特征提取

本研究主要根据SCL-90的测查结果进行特征学习和预测，因而先要将基本情况问卷中的无关数据清除，把10个因子的数据提取出来，包括F1：躯体化，F2：强迫，F3：人际关系，F4：抑郁，F5：焦虑，F6：敌对，F7：恐怖，F8：偏执，F9：精神病性，F10：睡眠、饮食。然后，研究者对量表总分和各因子项目总分做均分处理，以反映个体心理健康水平所处的级别位置。最后，研究者给均分定级，如表1所示。

表1 90项症状自评量表项目均分评级标准

2.数据归一化处理

因本研究采集的原始数据分布差异较大、维度较多，但为减少分布差异与维度对实验结果带来的影响，研究者将采用均值归一法对实验数据进行处理，将数据缩放到[-1，1]区间范围内，公式如下。

(1)

式中，xi表示每个样本数据值，mean(x)表示原始数据的均值，σ表示原始数据的方差，yi表示输出值。

3.基于GA+BP的模型构建

本研究以Python语言为基础，使用Pycharm编程工具，并利用tensorflow和Scikit-learn等框架进行构建模型。具体的软硬件实验环境如表2所示。

表2 软硬件实验环境配置

由于本研究的数据集多为浮点数，对预测的精确度要求较高，因此，为了降低计算量和算法的时间复杂度，研究者采用浮点数编码，即以实数表示种群中的各个体，并设定初始权重为区间[-1，1]内的随机浮点数。种群数量设置为100，选择算子采用轮盘赌算法，交叉算子采用单点交叉法，且交叉率设置为0.5，变异算子采用实数突变法，且变异率设置为0.1，迭代次数为30代。

同时，BP模型设置输入层10个神经元，隐藏层为一层，共32个神经元，激活函数参数为relu函数，输出层为5个神经元，设置alpha参数为0.01，学习率设置为0.01，设置最大迭代次数为3000次。为防止实验结果产生过拟合现象，BP模型设置dropout参数为0.3。

四、实验结果

(一)实验数据集结果

在收集的3097份数据中，心理健康水平正常、轻度、中度、偏重和严重的检出人数分别为1898人、1023人、150人、17人、9人。可能有心理危机的大学生共占38.71%，说明大学生心理健康整体状况不太乐观。由SCL-90的调查结果可知，大学生心理健康问题主要集中在强迫、人际关系和抑郁等维度，具体分布情况如图3所示。这与前人的调查结果比较一致。[11]

全新的人际关系、生活环境、学习模式和自我认知等[12]，容易使一些适应不良的大学新生成为心理健康问题的感染群体。及时进行心理干预，预防心理危机事件的发生，也是大学新生开展心理健康普查的根本目的。

(二)实验模型结果

根据已获得的3097份数据和构建的心理健康评级标准表，在大学生心理健康自动评级模型的基础上，本研究采用5折交叉验证法进行模型训练，即每次验证将数据集划分为80%的训练集数据和20%的测试集数据，并选取训练结果较不理想的一组进行实验结果分析。训练周期与损失值之间的关系如图4所示。

由图4可知，随着训练迭代次数的增加，该模型的训练集与测试集的损失值在降低，测试集的损失值略低于训练集。在500次迭代训练后，训练集和测试集的损失值都趋于平稳，且整体收敛效果较好。

为了能够看出训练集的心理健康水平等级的分类效果，本研究利用ROC曲线和AUC指标分别对训练集和测试集的五种评级标准的分类效果进行分析。其中，当AUC≤0.5时，表示模型训练分类效果较差；当0.5

由图5可知，心理健康水平的五种等级中评级A(正常)的AUC值最高(为0.9587)，说明该模型在训练集中识别正常级别的心理健康效果最好；而评级D(偏重)的AUC值最低(为0.6294)，说明该模型在训练集中识别偏重级别的心理健康效果最差。平均ROC曲线的AUC值达到了0.8235，说明该模型在训练集中的表现整体效果较好。

由图6可知，心理健康水平的五种等级中评级A(正常)的AUC值最高(为0.9815)，说明该模型在测试集中识别正常级别的心理健康效果最好；而评级D(偏重)的AUC值最低(为0.5000)，说明该模型在测试集中识别偏重级别的心理健康效果最差。平均ROC曲线的AUC值达到了0.8648，说明该模型在测试集中的表现整体效果很好。

比较图5和图6可知，该模型在测试集中的平均ROC曲线的AUC值高于在训练集中的平均ROC曲线的AUC值，且两者的AUC值都较高，说明该模型在测试集上的表现略好于训练集，反映了该模型针对心理健康水平数据集的等级分类问题取得了很好的效果。另外，该模型在识别心理健康水平A(正常)、B(轻度)、C(中度)级别的效果较好，在识别心理健康水平D(偏重)、E(严重)级别的效果略差。大部分大学生心理健康水平是正常的，检出心理异常的学生主要集中在轻度水平，心理状况偏重和严重的学生只占总人数的0.84%，因此，数据量过少是影响该模型识别心理健康偏重和严重级别效果的重要因素。

为了更客观地观察该模型在本研究的评级效果，研究者将测试集中数据的真实值和该模型所预测的预测值进行比较和检验。因本研究中测试数据量较大，不方便全部对比显示，所以研究者从测试集的首尾各选取15组数据，共30个数据对比绘制成表格。

由表3可知，在测试集的30个数据中，只有5个预测值与真实值不符，表示该模型的心理健康水平预测效果良好。

为了进一步检验基于GA+BP的大学生心理健康自动评级模型的性能，研究者选择传统的BP神经网络与基于GA+BP构建的大学生心理健康自动评级模型进行对比实验，使其参数、迭代次数、神经元个数、层数等设置与GA+BP模型保持一致，最后比较两种模型在Accuracy、Precision、Recall与F1四个指标上的差异，对比结果如表4所示。

表4 模型实验结果对比

由表4可知，相较于传统BP神经网络模型，GA+BP模型在预测大学生心理健康水平的精确率、准确率、召回率和F1值方面分别提升了1.78%、2.51%、1.78%和2.17%。这说明了GA+BP模型比传统BP神经网络模型的收敛速度更快，准确率更高，验证了基于GA+BP的大学生心理健康自动评级模型的可行性。

五、结语

通过心理普测筛查有心理危机的学生是一项重要手段。然而，大部分高校的大学生心理健康测评方式比较传统，形式单一、效率低下，其科学性、时效性和个性化存在一些质疑和挑战。[13-14]随着人工智能技术的发展，心理健康研究和计算机技术不断结合。从建立心理健康教育网站到完善心理评测系统，计算机网络技术在心理健康领域发挥着越来越重要的作用，智能化的心理测评手段应运而生。[15]本文提出的基于GA+BP的大学生心理健康自动评级模型，作为一种辅助手段，弥补了一些传统测评的不足之处，对大学生心理健康水平有较好的预测效果，能够在实际的心理测评中发挥有效的助力作用。