基于大数据的校园心理健康体系构建与开发路径研究
2022-04-22杨伟樱杨延波
杨伟樱 兰 天 杨延波
(陕西工业职业技术学院 陕西 咸阳 712000)
2017年10月习近平总书记在十九大报告中指出“要推动互联网、大数据、人工智能和实体经济深度融合”。据此,互联网时代的大数据储备、大数据运用正在以前所未有的方式改变着我们的社会,改变着学生的认知体系、改变着学生的学习、生活方式,改变了学生的心理健康状况。2021年1月24北京青年报等相关资料报道,全国有10%青少年需要心理健康干预,每年约有10万青少年死于自杀,平均每分钟就有2个青少年死于自杀,有8个自杀未遂,中国学生的自杀率在逐年攀升,令人堪忧,需要心理咨询服务的在校生出现爆发式的增长态势。以某高校21级大一新生为例,入校心理筛查初步预警人数占全院新生人数的21%,其中重点干预对象占比全院新生人数的7.4%。教育部在2021年11月对全国政协《关于进一步落实青少年抑郁症防治措施的提案》进行了答复,其中明确将抑郁症筛查纳入学生健康体检内容。
然而,我国的心理咨询发展仍处于初级阶段,各校虽然成立了各种各样的心理咨询机构,建立了心理咨询室,但校园心理健康咨询师的严重匮乏,致使校园心理咨询服务缺乏专业性、系统性的,完整的心理健康体系支撑,校园出现的抑郁症和各类心理疾病的高发,并未得到有效的控制和干预。究其原因,我国导致在校生自杀的主要原因之一是少子女及独生子女缺乏挫折教育,缺乏早期的心理健康诱导,缺乏早期的心理健康大数据采集、整理、分析和干预。为此,在心理健康教育过程中如何利用现代信息技术手段,对学生基础信息和行为数据进行采集和分析,建立学生心理健康档案和数据库,实施科学研判,危机干预,引导学生保持健康心态,是现阶段学生心理健康教育中需要迫切解决的问题之一。目前国外心理学建模,使用贝叶斯分类法进行研究的比较多,有使用深度学习进行心理学建模的发展态势,有较为完整的心理健康教育和咨询服务体系,但基于信息技术的心理健康心理学测量、大数据采集、分析、监控工作尚不十分完善,为此,基于大数据的心理健康体系建设研究尚需进一步挖掘和开发研究。
一、校园心理健康咨询现状分析
疫情期间,学生行动范围较为封闭,上网行为密集。据相关分析得知,网络中学生群体占比越来越高,其心理健康标准体系在大数据时代产生了重大变革,致使其认知、情感与行为方式发生了根本性的改变,同时给校园危机干预提供了海量化、实时化、个性化、可量化数据资源。在互联网技术高速发展的今天,网络社交媒体成为学生倾诉想法、宣泄情绪的重要平台,如何利用学生对于网络的迷恋,收集相关的心理危机信息,并为危机干预提供丰富而宝贵的数据,成为高校大学生心理危机干预面临的重要途径,因互联网技术的发展而带来的重要挑战之一。
(一)缺乏基于信息技术的监控手段
市面上暂且没有完整的基于大数据的学生心理健康心理学档案,难于通过现代信息技术手段对学生的心理健康基本情况进行全面的量化评估。
(二)各院校心理健康量化标准不一
传统的人工心理危机评估多依靠经验或直觉,反馈模糊延迟,量化评估与风险控制相对较为迟钝。
(三)缺乏完整的心理健康教育系统
一是尚未建立针对学生、学生家长、教师不同需求心理健康教育培养、培训的教育学习系统和教育教学资源,许多学校只进行学生心理健康情况收集,忽略了家庭、教师对学生心理健康的影响,缺乏完整的教育资源体系和优质资源,实施因材施教,对症下药。二是在学生的心理健康档案中,仅仅有档案是不够的,还需要建立学生的能力模型,帮助家长和老师通过学生能力模型,扬长避短,激发学生的发展潜能。三是许多社交平台信息中包含着学生的情绪和心理状态信息,但没有实时对获取心理健康信息的分析系统,无法实时预警,危机干预机制延迟僵化,效率低下,导致事故频发。
(四)危机干预缺乏可持续跟踪评估
在学生出现心理健康危机后,对危机信息的获取实时性差,干预的跟踪评估机制缺乏预见性、系统性、完整性和可持续性。
为此,帮助学校建立基于信息技术的大学生心理健康档案管理系统、心理健康教育及心理健康监控系统,已经成为刻不容缓的课题。
二、基于大数据的学生心理健康体系构建及系统功能设计
(一)系统基本功能模块设计
基于现代信息技术手段,以学生为主体通过大数据技术搭建青少年心理健康档案管理、心理健康教育及监控系统,并通过协同过滤算法推荐给合适的人群,帮助家长、教师正确教育学生,建立健康心理模型,并在健康管理系统中,设置一定量的健康教育课程,助力青少年健康成长,为此本项目主要从以下三个方面进行系统功能设计:
1.建立网上学生心理健康监测数据档案:重点围绕学生数据采集录入和分析以及影响学生心理健康成长的教师、家长数据采集、录入和分析,建立数据相关分析模型,实施三者之间的相关性分析,构建基于信息技术的学校心理健康管理平台。
2.搭建心理学健康教育模块(预防模块):抓取用户行为和用户属性信息作为影响因子,利用协同过滤算法,为用户精准推荐与之相关的心理学或家庭教育相关的内容。针对不同年龄、不同类型的学生及与之紧密相关的家长、教师开设线上心理辅导、健康教育直播课堂、心理健康专题讲座、心理学活动等。
3.开发网上心理健康自我诊断预警系统:基于网上学生心理健康数据分析,使用k-means算法进行聚类分析,监测、甄别学生心理健康状况,并实时加以预警;实时对密切关联的家长、教师心理健康状况进行分析、教学方式分析,对心理健康状况不佳、方法欠妥的家长、教师及时加以预警,实时通过网上预约等形式请心理健康导师进行干预,及时疏导学生、教师及家长心理。
(二)系统关键技术选择
优选k-means聚类分析技术、协同过滤算法等大数据技术应用于心理学领域的研究。目前校园心理学监控手段主要依靠教师人为感官、定期发放问卷抽查完成,现有的心理学监控算法也主要以主成分分析法为主。但主成分分析在精度上和效率上都有一定的不足,分析对象有比较大的局限性。因此本次研究课题将选择以上两种更高级的数据挖掘算法进行对比,选择最合适的算法用于系统的预警、分析、监测模块。
1.k-means聚类分析进行数据处理
本系统将基于k-means聚类分析方法开发心理健康监测系统,在传统系统的基础功能上,使用数据挖掘的思想对学生心理数据进行二次利用,通过对k-means算法的迭代过程优化,将大量沉淀的学生心理数据中有价值的部分提取出来,建立数据模型并向管理者提供决策引导,科学管理学生心理健康过程,既能有效的提高心理辅导的整体效率,同时也能对危险因素起到防患于未然的预警作用。K-means聚类分析是基于划分的聚类算法中最经典的算法。该算法具有以下两大优势: (1)甄别数据集大小和时间复杂度之间的线性关系,(2)它收敛于局部最优解。k-means的聚类过程演示如图1所示:
图1 k-means的聚类过程
2.协同过滤算法进行推荐
本系统心理学预防模块会涉及到内容推荐功能,将采用协同过滤算法实现。协同过滤一般是在海量的用户中发掘出一小部分与之品位(偏好)比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录优先推荐给用户。本系统主要应用基于用户的协同过滤算法(user-based collaboratIve filtering) 图2所示。要实现协同过滤,需要按照:A收集用户偏好,B找到相似的用户或物品,C计算推荐,三个步骤实现。
图2 基于用户的协同过滤算法(user-based collaboratIve filtering)
(三)系统设计的目标要求
1.基于大数据技术收集、整理和挖掘,建立学生校园心理健康数据档案管理平台。
2.通过算法对学生(家长)个性化案例分析,提出心理健康分析咨询报告,推荐相关的心理学辅导、诱导、教育内容,帮助家长和老师制订应对学生心理健康疾病预防和干预的有效应对策略。
3.探索利用数据挖掘技术实时监控学生个体的心理健康状况,并向监管部门、监管者(教师、家长)发出学生心理健康状况的预警通知,并推荐相应的服务心理健康咨询和教育机构,实时开展心理咨询或矫正。
三、基于大数据的学生心理健康系统开发技术路径设计
(一)技术路径
基于信息技术的产品技术框架如下图3所示,该项目的系统框架主要由四个部分组成:应用层、网络层、服务层和数据层。其中,不同于其他心理学平台之处在于,该系统数据层可支持含大数据存储、分析和管理。
图3 产品技术框架图
(二)技术创新设计
1.该系统构建了基于信息技术平台的心理健康大数据存储、分析、管理技术平台
该项目的心理健康档案建立可实现海量处理数据的大数据存储、分析和管理技术,解决现有的心理学档案以纸质档案或教师自制电子文档为主且实时性差、数据分析能力差的问题。因此本项目主要对数据层技术进行阐述。数据层使用Hadoop+hive+spark技术框架,Hadoop是一个分布式计算框架, Hadoop则是大数据处理的基石,其他框架多以数Hadoop为基础,从各个方面的不同角度进行优化和改进并加以演变而成,由此,也形成了一个强大而完善的Hadoop生态圈,从而支撑着现在日益庞大的数据处理量。Hive是基于Hadoop的一个数据仓库工具。简单来说就是它可以用SQL(准确的说是HQL)来查询和处理文件,因为它可以把文件映射为一张表。业务数据经过初步处理(数据清洗、结构化)后存入Hive,为以后的报表分析、实时计算做好数据准备。Spark是一个基于内存计算的并行迭代计算框架,可同时支持批处理或流处理。Spark在机器学习方面有着无与伦比的优势,更适合需要多次迭代计算的算法。同时Spark拥有非常出色的容错和调度机制,确保系统的稳定运行,Spark目前的发展理念是通过一个计算框架集合SQL、Machine Learning、Graph Computing、Streaming Computing等多种功能于一个项目中,具有非常好的易用性。如图4所示。
图4 基于大数据的心理健康平台框架图
2.针对心理健康撒数据分析,通过深度学习算法融合推荐算法,让推荐内容更加精准
融合深度学习算法和推荐算法,预警模块使用k-means深度学习的方法获得的特征类别,除了可以作为预警信息外,还可以作为预防模块推荐信息的影响因子,将特征值作为影响因子之一收集进入协同过滤算法中,并提高其权重,可以提升前端内容推荐的准确度,确保学生和家长在前端获得更适合自己的内容。如图5所示。
图5 预警模块使用k-means深度融合学习的
四、系统推广应用前景分析
(一)项目校内应用前景分析
该项目主要是由校内的互联网+创新团队和地方心理学会合作联合开发,通过建立学生心理健康档案,帮助学校实时监控、预警、疏导、教育和矫正学生的心理健康情况,同时将学生的健康数据、推荐给需要心理咨询学生的教师、家长以求其提供必要的协作。
(二)校外应用前景分析
通过B2C口碑获得相关学习课程,线上运营促留存的方式吸引用户进入app使用,保护线上散户渠道;通过B2B的方式连接学校相关管理部门、相关学工部门的办公系统、社会心理咨询组织机构、家长等,拓展运行及服务领域,扩展平台客户服务渠道,实时监测大学生心理健康数据运行状况,从而提高大学生心理健康咨询效能。