基于深度挖掘的青年心理健康信息采集系统设计
2022-04-26马进
马进
(山东电力高等专科学校,山东济南 250002)
1 引言
青春期心理异常或心理问题比较复杂多样,也有其自己的特点,易产生各种心理障碍问题。所以,在进行心理咨询时,有必要对青年心理问题产生的原因进行深入研究[1]。青年人通常在18至23岁之间,处于此年龄段的青年,智力处于黄金时期,但大多是在独生子女家庭中长大,心理发育不成熟。与此同时,青年难以适应周围的环境和生活,心理健康状态处于一个极不稳定的动态变化过程之中[2]。所以,在处理学习、工作、社交、情绪等问题时,经常会产生心理失衡和危机事件。为此,该领域研究者对青年者的心理相关数据进行了采集,且取得了一定成果。
陈可等人提出设计智慧健康信息采集终端[3]。该采集终端设计的出发点主要是为了满足人们健康需求状况,在USB 接口基础上,设计了个人健康信息采集终端系统。该系统包括信息采集模块以及软件设计。通过获取相关数据,然后通过USB 接口传输到计算机,实现数据的采集。但该系统主要针对人体健康数据进行采集,采集的实时数据较为准确,但该系统针对青年心理健康数据考虑甚少,存在一定局限性。李召等人提出设计基于安卓音频接口的多参健康检测终端[4]。该系统的单片机是以Msp430,对人体数据进行采集,设置特殊的通信协议,借助手机音频接口进行传送,该系统采集数据的速度较快,但该系统采集的青年数据较少,存在一定误差。
基于此,本文提出设计基于深度挖掘的青年心理健康信息采集系统。通过系统硬件及软件的设计,实现青年心理健康数据的采集,具有一定可行性。
2 系统硬件结构设计
基于深度挖掘的青年心理健康信息采集系统,主要包括三个部分:信息收集、采集控制服务器和信息发布服务器,如图1所示。
由图1可知,该系统内部设置多个信息采集器进行同时数据的并行采集,但采集控制服务器和信息发布服务器仅为一个。服务器可以分别安装在3台机器上,也可以两台机器任意组合安装,如果空间允许,服务器也可以安装在一台机器上,但服务器必须通过修改监听端信号,才能独立操作,不相互干扰。
图1 系统硬件结构
2.1 信息采集器
基于网络信息挖掘引擎的一种信息采集系统,能在最短时间内,从不同网站获得最新信息,统一格式后,将信息及时发布到自己的网站上。可以提高信息的及时性,节省或减少工作量,信息收集器结构如图2所示。
图2 信息采集器结构
由图2可知,信息采集器是一个联机资讯资源收集工具,该系统能自动收集因特网上的有效信息,包括文字、超链接文字、图片、声音、视频、压缩文件等,并能定期自动更新站点原始信息[5]。支持自动信息收集功能,通过分析指定范围内链接,搜索未知网站,用户可以自动查看并筛选未知网站。假定网站是有向图,则网站中每个网页都是图中的一个节点,超文本文件中的链接是有向图的边缘。以用户输入的初始爬行页面作为图的根节点,采用图宽优先遍历算法收集站点[6]。
2.2 核心交换机
核心交换机具有大容量的转发功能,在48口上,数据中心交换机必须支持高密度的10千兆板,实现48口10千兆板的全速转发,数据中心交换机必须采用CLOS分布式交换架构。
核心交换机是指网络中直接面向用户或接入网络的部分为接入层,在接入层和核心层之间的部分称为分散层或会集层。接入层的目的是使终端用户与网络相连。因此,接入层交换机成本低,端口密度高;聚合层交换机是多访问层交换机的集合体[7]。该系统必须能够处理接入层设备的所有流量,并提供上行连接到核心层。核心层的主要目标是提供一个可靠的主干传输结构,实现信息高效传输,保证核心层交换机应用的可靠性。
2.3 数据库
资料库是以某种方式储存的一组已处理资料,可供多个使用者分享及减少冗余,其结构如图3所示。
图3 数据库结构
由图3可知,资料库伺服器是储存资料库及执行资料库管理系统及相关软体的电脑。为了稳定存储,大多数数据库服务器是具有超级存储空间和独立磁盘冗余的多处理器服务器。单独磁盘冗余阵列是为了确保在磁盘损坏或出现故障时能够恢复数据。
3 软件功能设计
由于青年健康信息系统的需要以及系统本身的特点,特别是为了提高系统用户的作用,采用parameter-driven 和表格数据处理技术,可提高系统的安全性能、稳定性和灵活性,从而减少系统维护的工作量。
依靠数据库定义数据字典来进行后续数据查询和分析,使之能适应数据库结构的变化和调整,并能通过系统提供统一数据访问界面。
3.1 信息深度挖掘
青年心理健康信息数据的特征向量不同频率成分在整个特征变化过程中,高频功率越大,说明心理变动速率越快,反之则慢[8]。信息深度挖掘流程如图4所示。
图4 信息深度挖掘流程
青年心理健康信息经过一定时间累积后,根据功率谱密度估计青年心理特征变化趋势,其功率谱是由心理特征向量元素构成的功率,根据该变化提取设备中有限数据。
设ρx(a)表示青年心理特征向量x(n)的相关线性函数;Pxx(ω)表示功率谱密度,其计算公式为:
式中,e表示青年心理出现疾病的事件,j表示采集次数。
相关线性函数ρx(a)表达式为:
式(2)代入公式(1)可得到功率谱密度:
对公式(3)求取平均值为:
在实际数据处理过程中,由于针对某个青年心理,只能全局心理特征序列监测,因此,使用有限数据序列x(0),x(1),x(2),…x(N)估计功率谱密度,由此得到:
通过上述公式可知,当青年心理情绪波动较大时,功率谱密度将变大,产生高频反馈,这些信息注入心理特征后,更新频率绝对值之和,将反映出青年心理反应状况。
3.2 青年心理数据动态排查
通过对学生进行动态心理跟踪,可以对学生进行准确危机预警,每个班级的心理学家每两周到宿舍填写一次“学生心理健康动态表格”,并通过学生心理健康跟踪评估系统,向班主任和二级学院的心理辅导员报告。班主任或二级学院心理咨询师通过系统(上一次数据访问记录表和获得的心理普查测试结果),选择需要关注的人,将青年的信息记录在案,并将问题危机预警、报告和信息“存档”。
3.3 信息采集流程设计
在本单元内,基本健康信息的收集提供了添加和修改健康调查问卷的功能。该系统首先为用户提供收集基本健康信息的查询页面。用户可以通过此功能创建新的个人通用信息,增加功能与普通信息维护功能一致。标准搜索完成后,系统显示符合搜索条件的人员列表,选择列表中需要收集基本健康信息的个人记录,双击进入常规信息确认页面,并填写个人确认常规信息正确。如有错误,可在此页面选择要修改的修改功能。如果信息正确,单击确定后填充基本健康信息。各种类型报告完成和提交后,系统会根据报告内容显示结论和建议。青年心理健康基础信息见表1。
表1 青年心理健康基础信息
基于此,设计的信息采集流程,如图5所示。
图5 信息采集流程
由图5可知,信息采集执行过程包括添加、查询、删除和修改个人总信息,并可导出查询的个人信息列表。输入到常规信息维护页面,可进入“新建页面”,添加新人员信息;同时也可以查询现有的个人资料。如果是系统全局管理员,可以用三种方法查询ID号、名字、单元;如果是单元管理员,第三种方法是查看单元的用户,在列表中显示查询结果,可以查看、删除和修改列表,由此获取最精准列表信息。
4 实验分析
在Visual Studio2010可视化开发平台下,对基于深度挖掘的青年心理健康信息采集系统进行实验验证分析。当前最新版本为10.0版本,通过该平台可以可视化展示实验结果。
4.1 测试环境
系统测试环境可以分为如下层次:
界面层:运行Web界面,为测试结果提供客户端;
服务器层:在Web 界面层,提供网络接口,并部署网络环境;
数据库服务层:该层次支持数据访问,管理数据库事务。
在该环境下,系统可以单机运行。
4.2 实验结果分析
将语句覆盖率最低不能小于80%、测试用例执行覆盖率应达到100%为指标,通过对比本文系统以及其他两种传统系统,将两种传统系统分别设为W1和W2,将本文系统设为W3,进行对比实验分析。
4.2.1 语句覆盖率
语句覆盖率计算公式为:
公式(7)中,M表示被评价语句数量;N表示可执行语句总数。分别使用三种系统语句覆盖率,实验对比结果如表2所示。
表2 三种系统对比语句覆盖率
由表2可知,基于深度挖掘采集系统语句覆盖率较高。
4.2.2 测试用例执行覆盖率
用例执行覆盖率计算公式为:
公式(8)中,T表示至少被执行一次的用例数;T'表示总用例数。实际情况下,测试用例执行覆盖率,实验结果如图6所示。
图6 实际情况下测试用例执行覆盖率
区域1为重合部分,区域7为无效用例,红色圈表示测试用例执行覆盖率覆盖到的范围。分别使用三种系统测试用例执行覆盖率,对比结果如图7所示。
图7 三种系统测试用例执行覆盖率
由图7可知,使用W1 系统进行信息采集系统测试用例执行覆盖率比实际情况下的覆盖率面积要小,使用W2信息采集系统测试用例执行覆盖率比实际情况下的覆盖率面积要大,使用基于深度挖掘采集系统测试用例执行覆盖率与实际情况覆盖率面积一致。
通过上述分析结果,可确定基于深度挖掘采集系统语句覆盖率高、测试用例执行覆盖率与实际情况一致,由此说明采集效率较高。
5 结束语
基于深度挖掘的青年心理健康信息采集系统是将深度挖掘技术与心理学知识相结合,通过排查青年心理动态数据,初步实现信息采集目的。根据学生测评结果,可验证该系统信息采集全面且精准度较高,为学生逐一沟通提供方便。