居民自杀未遂环境因素BP神经网络模型构建*
2020-06-28吕军城卓来宝邹广顺
吕军城 卓来宝 邹广顺 张 杰
【提 要】 目的 探讨自杀未遂的环境影响因素,构建环境因素BP神经网络模型。方法 采用病例-对照研究方法收集数据,采用单因素方法初步筛选环境影响因素,构建BP神经网络模型。结果 本研究1200例样本中,自杀未遂者639名,占53.25%,对照组561名,占46.75%。单因素分析结果显示健康状况差、患有精神疾病、迷信、有宗教信仰、受教育年限少是自杀未遂个体环境危险因素;无个人财产、家庭经济状况差是其经济环境危险因素;夫妻关系差、与父母关系差、家中地位低、家中成员有过自杀行为、家庭人口数少是其家庭环境危险因素;社会关系差、遇到困难缺少帮助,受教育机会少、就业机会少是社会环境危险因素;BP神经网络模型的总体符合率为69.6%,判别效果良好。结论 应采取相应的预防措施降低自杀未遂的危险因素;本研究构建的环境因素BP神经网络模型具有较好判别效果。
自杀未遂指出现了自杀意念的人采取了自杀行动而未能成功。自杀动机不强烈、自杀行为不果断的人,往往造成自杀未遂[1],自杀未遂是自杀的重要危险因素[2-3]。调查研究表明,近20年我国的自杀率有所下降[4],但仍是影响我国死亡率的一个重要因素。最新研究结果表明,2012年至2015年我国的年平均自杀率为6.75/10万人,农村高于城镇,男性高于女性[5]。自杀行为对家庭、社会造成沉重的负担和医疗资源的浪费,并且产生严重社会负面影响。以往研究显示环境因素是自杀未遂的重要影响因素[6-8],本研究通过构建BP神经网络模型,探讨环境因素对自杀未遂的作用,并提出合理化预防对策和建议。
对象与方法
1.研究对象和资料来源
本研究以某省居民为研究对象,通过医院获取自杀未遂者(病例组)信息,按性别相同、年龄相仿等原则为病例组选择对照(对照组)。采用自行编制“居民自杀未遂环境调查问卷”采用面对面访谈的形式进行资料收集,具体纳入和剔除标准及资料收集过程参见文献[1],在此不再赘述。收集数据后对数据进行筛检和逻辑检错,剔除缺失值较多和调查质量欠佳的个体数据。
2.统计分析方法
结 果
1.一般情况
本研究样本病例组639名,占53.25%,对照组561名,占46.75%;病例组为(31.63±8.10)岁,对照组为(32.00±8.22)岁,两组间年龄差异无统计学意义(t=-0.772,P=0.440);病例组(男61.5%)和对照组(男62.6%)、性别差异无统计学意义(χ2=0.144,P=0.705);表明两组间性别、年龄因素均衡性较好。
2.初步筛选环境影响因素
统计分析结果显示,个体环境因素方面躯体健康状况、宗教信仰、是否迷信、是否患有精神疾病、受教育年限5个因素在两组间差异有统计学意义;经济环境因素方面,是否拥有个人财产、家庭经济状况2个因素两组间差异有统计学意义;家庭环境因素,两组在夫妻关系、和父母的关系、家庭地位、家中成员有无自杀、家庭人口数的差异有统计学意义;以往研究表明社会环境不良是自杀未遂的主要危险因素[9],本研究显示社会关系是否融洽、遇到困难时是否获得帮助、受教育机会、就业机会4个社会环境因素两组间差异有统计学意义。分析结果见表1。
3.BP神经网络模型构建
本研究为自杀未遂识别问题,选用patternnet函数,采用trainscg共轭梯度算法构建含有输入层、隐含层、输出层经典的三层BP神经网络模型。本研究将单因素筛选的16个影响因素作为输入层神经元,将是、否自杀未遂作为输出层2个节点;将输入、输出样本进行归一化处理,然后采用随机化方法将70%作为训练样本,15%为测试样本,15%为验证样本对BP神经网络模型进行创建和训练,运用均方误差和匹配矩阵等对模型进行评价。
表1 病例组和对照组环境因素影响因素分析
备注:*为非参数统计检验方法,#为Fisher确切概率法求得的概率值。
通过程序对样本数据进行多次模拟训练,通过比较总体符合率、灵敏度、特异度、迭代次数及ROC曲线,确定最优的BP神经网络模型,多次训练模型结果如表2。
由表2可以看出,net1的训练样本、验证样本、测试样本、总样本的各总体符合率比较稳定且较高、灵敏度和特异度比较均衡均为0.7,综合考虑net1神经网络模型为最优模型。输出结果显示网络性能值(performance)为0.219,梯度为(gradient)0.00491,均方误差(MSE)经过6次升高后停止训练,网络误差曲线显示网络误差(0.22698)较小,网络的收敛好。同时输出训练集、验证集、测试集和全部样本的判别输出结果与真实结果的匹配矩阵(confusion matrix),如图1所示;通过匹配矩阵可以评价模型分类效果优劣。
表2 多次训练模型的各项评价指标
图1 BP神经网络匹配矩阵图
模型的匹配矩阵显示各样本灵敏度在63%左右,特异度大多在75%~80%,总符合率约70%及以上;将同样数据采用传统的logistic方法分析,总符合率为64.6%,由此可见构建的模型较传统线性模型具有较好的判别性。通过运行 w1=net.iw{1,1}和w2=net.lw{2,1}命令,可以输出每个输入单元与隐含层单元的权重系数Wij和每个隐含层单元与输出层单元的权重系数Wjk,通过权重系数大小可以分析各因素间的关系和影响程度大小。
讨 论
自杀未遂作为一种严重影响我国居民健康的社会问题,其原因是多方面的。环境是人们赖以生存的外界条件,环境因素是自杀未遂的重要影响因素[8,10-11],本研究从个体环境、经济环境、家庭环境、社会环境等方面初步筛选自杀未遂环境因素,构建自杀未遂BP神经网络模型。
针对单因素筛选的自杀未遂环境危险因素,应采取相应措施降低环境的危险因素。个体方面应加强体育锻炼提高身体素质,掌握调节心情的基本技能保持良好的心态,增加受教育年限,以科学的态度对待宗教、杜绝迷信。经济环境方面应进一步探索公平合理的分配机制,减少相对贫穷导致的心理扭力;对经济特殊困难的人群应启动特殊人群社会保障机制和帮扶机制。家庭环境方面,夫妻间、子女与父母间、家庭成员间应倡导和营造平等、和谐、互助的家庭关系;本研究与以往研究结果一致,家庭亲密度高为自杀未遂的保护性因素[12]。社会环境方面,本研究与以往文献结果一致,较差的社会环境容易导致自杀未遂[13],应营造融洽、和谐、互帮互助的邻里环境和社会环境;失业是自杀未遂的危险因素[14],社会行政职能部门应营造公平、公正的社会环境,创造更多的均衡的受教育和就业机会。
BP神经网络模型作为一种新型的人工智能判别方法,近几年逐渐应用于医学领域并获得了理想的分类和识别效果[15-17],但是应用于自杀未遂尚处于探索阶段。本研究基于单因素筛选的16个影响因素作为输入层,构建含有6个隐含层节点数的自杀未遂环境因素神经网络模型,模型判别的符合率达到70%左右,显示了良好的判别效能;相对于以往传统统计学方法具有一定优越性[18-19],本研究验证了该方法在自杀未遂识别领域的适用性和可行性,进一步奠定了方法学理论基础。人工神经网络起源于神经生物学,是一种较新的人工智能方法,以往传统的统计学方法如线性模型、logistic回归模型等线性模型通常对资料有严格的适用条件,而神经网络模拟人脑智能化,具有高度的容错性、智能性、适应性、灵活性等特点,对资料要求宽松,更能最大限度的模拟或识别变量间复杂、模糊的线性和非线性映射关系[18,20];而且神经网络更适用于对个体的判别,更具有实用价值[21]。可以尝试将自杀未遂神经网络和计算机技术相结合,构建人工智能辅助诊断系统,对自杀未遂人群筛检具有重要的现实意义。