基于人工神经网络的贵州省少数民族卫生服务利用预测模型研究
2021-03-09刘婵婵胡嘉琦樊兴颖周涵妮
杜 薇 刘婵婵 李 端 胡嘉琦 樊兴颖 周涵妮 常 悦▲
1.贵州医科大学医药卫生管理学院,贵州贵阳 550025;2.贵州医科大学科技处,贵州贵阳 550025
“健康中国”2017年首次在总理政府工作报告中提出,以农村和基层为重点“提高居民健康素养水平”在《“健康中国2030”规划纲要》中被纳入为建设健康中国的十三个主要指标体系之一[1],十九大报告中阐述“人民健康是民族昌盛和国家富强的重要标志”。这些都意味着健康是民众生活的美好期盼,推进国民健康事业是最终实现全面发展的基本保证。提供卫生服务是推进健康事业的手段。个体从婴儿时期的出生到衰弱老人时期的临终,无不连续地需要卫生服务[2]。
健康素养指的是个人根据自身的知识储备,获取并理解健康领域的知识,并运用这些信息做出正确的健康行为决策,以促进和保持自身健康水平的能力[3]。世界卫生组织得出研究结论:健康素养与人均期望寿命、生命质量高度相关[4-5]。因此,研究健康素养对卫生服务利用的影响,有助于实现卫生资源的合理配置。本研究旨在提供一种新的方法研究贵州省少数民族健康素养对卫生服务的利用影响,构建卫生服务利用预测模型,让贵州省少数民族的卫生服务利用预测向智能化发展。
1 资料与方法
1.1 一般资料
采用多阶段分层抽样,于2019年6~12月在贵州省6 个市(州)抽取少数民族个体进行调查,共发放问卷1080 份,回收1031 份,有效回收率为95.46%。纳入标准:贵州省常住人口;少数民族;自愿参与本次调查。排除标准:精神障碍、认知障碍者。
被调查样本的基本特征方面,男482 名(46.75%),女549 名(53.25%);城镇225 名(21.82%),农村806名(78.18%);年龄15~69 岁;初中及以下学历459 名(44.52%),高中或中专学历168 名(16.29%),大专及以上学历404 名(39.19%);平均月收入1000 元及以下543 名(52.67%),1001~3000 元275 名(26.67%),3001~5000 元165 名(16.00%),5001~10000 元38 名(3.69%),10001 元及以上10 名(0.97%)。
1.2 调查方法
研究负责人统一培训课题组成员,贵州医科大学医药卫生管理学院熟悉少数民族语言本科生担任调查员,由调查员携带问卷分赴贵州省6 个市(州),按照调查方案和调查计划的要求,对被调查者进行访谈,并按照问卷的格式和要求来记录被调查者的回答。问卷内容包括以下三个部分。
第一部分基本情况,包括性别、年龄、学历、职业、平均月收入等。
第二部分参考原卫生部委托中国健康教育中心2015年制定的最新版《全国居民健康素养调查问卷》[4]。根据知信行理论分类,问卷可以分为三个方面,分别为基本健康知识和理念、健康生活方式与行为、基本技能;根据公共卫生问题为导向分类,可以将问卷分为六类,分别为科学健康观素养、传染病防治素养、慢性病防治素养、安全与急救素养、基本医疗素养和健康信息素养。
第三部分为卫生服务利用,包括4 周患病率、4周门诊服务利用率、年住院率。
选取150 名对象进行预调查,得到问卷的Cron bach′s α 系数为0.730,平均效度为14.2,内部一致性高,内容符合主题。
1.3 统计学方法
1.3.1 单因素分析
采用SPSS 22.0 统计学软件进行数据分析,符合正态分布的计量资料采用均数±标准差(±s)表示,两组间比较采用t 检验,不符合正态分布者转换为正态分布后行统计学分析;计数资料用率表示,组间比较采用χ2检验,以P<0.05 为差异有统计学意义。
1.3.2 多因素分析
多因素分析采用人工神经网络模型。人工神经网络的工作原理是模仿人脑结构,根据所提供的数据,通过学习和训练,建立由自变量到因变量的模型[6]。输入和输出之间的关系不是线性的。根据输入的信息建立神经元,通过学习规则或自组织等过程建立相应的模型,并不断修正,使输出结果与实际值之间的差距不断缩小[7]。人工神经网络的具有高速运算的能力,模拟人脑进行自学习、自组织。其由输入层、隐含中间层、输出层组成,结构如图1所示。结构简单、意义明确、步骤分明。
图1 人工神经网络模型
本研究采用Matlab 神经工具箱构建网络结构,步骤如下。
①将所有数据导入Matlab。
②打开Netural Net Fitting 工具箱,建立神经网络,导入网络,确立输入层、输出层;确定所有数据中训练集、验证集、测试集的比例分配。
③设置中间层的节点数,确立传输函数。
④开始进行训练,可以加入修正数据进行权值修正。
⑤训练结束,验证并测试结果。
2 结果
2.1 卫生服务利用现状
被调查的1031 名少数民族样本中,4 周内因患病利用门诊服务的人数为73 名,门诊服务利用率为7.08%;1年内因患病利用住院服务的人数为87 名,住院服务利用率为8.44%。
2.2 影响门诊服务利用的单因素分析
贵州省少数民族门诊利用组的一般资料、健康素养总分及各类别不同得分与门诊未利用组比较,差异无统计学意义(P>0.05)(表1)。
表1 被调查少数民族4 周内门诊服务利用的单因素分析(n=1031,分,±s)
表1 被调查少数民族4 周内门诊服务利用的单因素分析(n=1031,分,±s)
基本特征门诊利用组(n=73)门诊未利用组(n=958)χ2/t 值 P 值城镇[n(%)]男性[n(%)]年龄[岁,n(%)]15~25>25~35>35~45>35~55>55~65>65~69文化程度[n(%)]小学及以下初中高中或中专大专大学本科及以上职业状况[n(%)]在校学生务农就业失业或无业退休平均月收入[元,n(%)]1000 及以下1001~3000 3001~5000 5001~10000 10001 及以上健康素养总分按知信行分类基本健康知识和理念健康生活方式与行为基本技能按公共卫生问题导向分类科学健康观素养传染病防治素养慢性病防治素养健康信息素养安全与急救素养基本医疗素养19(26.0)41(56.2)206(21.5)441(46.0)0.902 1.673 0.428 0.376 0.095 0.669 39(53.4)13(17.8)8(11.0)8(11.0)3(4.1)2(2.7)530(55.3)169(17.6)123(12.8)80(8.4)18(1.9)38(4.0)1.5880.113 15(20.5)23(31.5)13(17.8)4(5.5)18(24.7)147(15.3)274(28.6)155(16.2)93(9.7)289(30.2)0.0190.985 32(43.8)14(19.2)19(26.0)8(11.0)0(0.0)421(43.9)161(16.8)306(31.9)58(6.1)12(1.3)0.4920.623 41(56.2)18(24.6)10(13.7)4(5.5)0(0.0)32.16±10.79 13.93±4.91 10.01±3.82 8.22±3.41 4.73±2.20 4.11±1.51 5.12±2.59 3.53±1.95 8.23±3.35 6.44±2.46 502(52.4)257(26.8)155(16.2)34(3.6)10(1.0)33.77±10.73 14.87±4.72 10.66±3.98 8.24±3.37 4.98±2.14 4.06±1.59 5.76±2.59 3.54±1.94 8.74±3.17 6.70±2.52 1.229 1.628 1.345 0.041 0.969 0.265 1.149 0.898 1.307 0.840 0.219 0.104 0.179 0.967 0.333 0.791 0.253 0.371 0.191 0.401
2.3 影响住院服务利用的单因素分析
贵州省少数民族住院利用组和住院未利用组的职业状况比较,差异有统计学意义(P<0.05);住院未利用组的健康素养总分、健康信息素养、安全与急救素养得分高于住院利用组,差异有统计学意义(P<0.05)。住院利用组的其他基本特征、健康素养其他类别得分与住院未利用组比较,差异无统计学意义(P>0.05)(表2)。
表2 被调查少数民族1年内住院服务利用的单因素分析(n=1031,分,±s)
表2 被调查少数民族1年内住院服务利用的单因素分析(n=1031,分,±s)
基本特征住院利用组(n=87)住院未利用组(n=944)χ2/t 值 P 值城镇[n(%)]男性[n(%)]年龄[岁,n(%)]15~25>25~35>35~45>35~55>55~65>65~69文化程度[n(%)]小学及以下初中高中或中专大专大学本科及以上职业状况[n(%)]在校学生务农就业失业或无业退休平均月收入[元,n(%)]1000 及以下1001~3000 3001~5000 5001~10000 10001 以上健康素养总分按知信行分类基本健康知识和理念健康生活方式与行为基本技能按公共卫生问题导向分类科学健康观素养传染病防治素养慢性病防治素养健康信息素养安全与急救素养基本医疗素养22(25.3)42(48.3)203(21.5)440(46.6)0.817 0.298 0.888 0.414 0.766 0.375 52(59.8)16(18.4)10(11.5)3(3.4)2(2.3)4(4.6)517(54.8)166(17.6)121(12.8)85(9.0)19(2.0)36(3.8)0.862 0.389 8(9.2)28(32.2)17(19.5)5(5.7)29(33.3)154(16.3)269(28.5)151(16.0)92(9.7)278(29.4)2.243 0.025 41(47.1)9(10.3)25(28.7)11(12.7)1(1.2)412(43.6)166(17.6)300(31.8)55(5.8)11(1.2)0.965 0.335 45(51.7)19(21.9)17(19.5)5(5.8)1(1.1)32.16±10.79 498(52.7)256(27.1)148(15.7)33(3.5)9(1.0)33.77±10.73 2.267 0.024 13.71±4.70 9.76±4.02 7.69±3.47 14.90±4.73 10.70±3.96 8.28±3.36 0.543 0.789 1.575 0.589 0.430 0.115 4.67±2.18 3.85±1.56 5.30±2.57 3.38±1.67 7.41±3.47 6.55±2.43 4.99±2.14 4.08±1.59 5.75±2.59 3.55±1.96 8.82±3.13 6.69±2.52 1.335 1.298 1.561 2.108 3.974 0.485 0.182 0.195 0.119 0.035 0.000 0.628
2.4 基于人工神经网络的贵州省少数民族卫生服务利用预测模型
2.4.1 神经网络初始化
由上述单因素分析,门诊利用组与门诊未利用组的不同基本特征、健康素养总体及各类别得分比较,差异无统计学意义(P>0.05)。而住院未利用组的职业状况、健康素养总分、健康信息素养、安全与急救素养得分与住院利用组比较,差异有统计学意义(P<0.05)。因此,本研究利用人工神经网络构建住院服务利用预测模型。
2.4.1.1 输入层与输出层的确定 职业状况(P=0.025)、健康信息素养(P=0.035)、安全与急救素养(P=0.000)三个因素均有统计学意义,因此,输入层设置为职业状况、健康信息素养、安全与急救素养3 个节点。输出层确定为住院服务利用1 个节点。
2.4.1.2 数据标准化 由于职业状况与健康信息素养、安全与急救素养不是同一类变量,数值相差较大,需采用min-max 标准化(min-max normalization)对其进行处理[8],将其映射到(0,1)之间,采用的公式如下:。
2.4.1.3 中间隐含层节点数量的确定 中间隐含层的神经元节点数对人工神经网络模型的预测精度有较大的影响,节点数过多会导致过度拟合,且增加训练时间;节点数过少会出现欠学习状态,从而削弱了模型的预测能力[9]。根据经验公式[10]:(Z 为中间层节点数,n、m 分别为输入层、输出层节点数,a为1~10 之间的整数常数)。本研究确定的n、m 分别为3、1,根据公式计算,模型中间层节点数为(3,12)。
2.4.2 神经网络训练
Matlab 的神经工具箱中,网络设置为具有S 形的隐藏神经元和线性输出的神经元(fitnet)的双层前馈网络,如图2所示。输入层和隐含层的传递函数为tansig 函数,输出层的传递函数为purelin 函数,使用traincg 算法。学习率设置为0.05,迭代次数为1000次。在Matlab 中,训练函数Levevberg-Marquardt 法(L-M算法)收敛速度快且均方误根差最小,表现效果最优[11]。
图2 Matlab 神经工具箱的网络设置
神经网络建立好以后,导入经过标准化处理后的1031 组样本。将数据集按照70∶15∶15 的比例分为训练集、验证集和测试集。训练集用于训练模型,验证集用于衡量训练集构建网络,验证完成后再用测试集样本数据进行测试,确定所建立人工神经网络模型的有效性。
2.4.3 网络模型建立结果
根据上述初始化设置建立网络,调整中间层神经元个数,直到均方误差(MSE)最小,MSE 指的是输出和目标之间的均方差,值越低越好。调整中间层节点数从3~12,训练网络,确定隐含层为10 个时,为最优神经网络结构。如表3所示。
表3 各中间隐含层节点数的人工神经网络模型MSE
迭代次数与MSE 的关系如图3(封三)所示,蓝线为训练数据,绿线为验证数据,红线为测试数据。模型中,训练集、测试集、验证集数据的表现类似。最优表现为当训练次数为4 次时,MSE 达最小值,为0.069 076。
图3 迭代次数与MSE 关系图(见内文第7 页)
2.4.4 模型验证
为检验所建立的人工神经网络模型的有效性,训练前,将数据中的15%,共155 组数据设定为测试集,用于进行模型验证,结果见图4,所有测试集样本数据误差的绝对值均不超过1,且误差在0 附近的频数最大。由此可见,预测住院服务利用的人工神经网络模型预测准确,本模型有效。
图4 测试样本数据误差分布图
3 讨论
本研究构建的人工神经网络模型显示,职业状况、健康信息素养、安全与急救素养显著影响贵州省少数民族的住院服务利用。健康信息素养是指个体意识到自身对健康信息的需求,熟悉掌握检索健康信息的方法,评价检索到健康信息的质量,并根据自身具体情况,选择适合的信息分析和运用来做出健康决策[12]。安全与急救素养是个体应对突发地震、洪涝、爆炸、火灾、食品安全、交通事故等公共安全问题的能力,体现了个体的安全和急救方面的认知和能力[13]。健康素养是影响卫生服务利用的重要影响因素[14]。低健康素养水平导致低自我健康管理行为水平,伤害、发病的增加,治疗依从性差,疾病自我管理能力低,从而影响人的生命和生活质量,并增加对卫生服务的利用。
掌握正确的卫生服务利用影响因素,有利于在卫生资源有限的前提下,找准针对性的健康教育实施路径,深化医药卫生体制改革,为制定促进卫生服务合理利用的政策提供科学依据。
本研究旨在提供一种简便、高效的方法,对卫生服务的利用进行科学预测。人工神经网络和Logistics回归模型不同,其是一组程序控件构成的“黑箱”,输入和输出之间的关系在“黑箱”中,且为高度非线性的关系,需要借助R 语言、Matlab、Python 等实现和应用[11]。因此,构建人工神经模型,将拟合效果较好的模型储存到模型库中,让贵州省少数民族卫生服务利用的预测向智能化发展。
同时,本研究的主体是贵州省少数民族。少数民族群体作为中华民族的重要组成部分,促进其健康水平,关系到国家的长久治安,对实现民族地区的和谐稳定,维护国家发展具有积极的政治意义[15]。
综上所述,职业状况、健康信息素养、安全与急救素养显著影响贵州省少数民族住院服务利用。人工神经网络模型准确率较高,能应用于进一步的卫生服务利用预测。