基于径向基神经网络下糖尿病治疗方案的评价
2018-01-15陈恩宏刘陈帅贾学勇
陈恩宏 刘陈帅 贾学勇
摘要:研究影响糖尿病治疗效果的特征向量与病人再次入院率之间的联系,其中,特征变量通过主成分分析可得出有效评价指标为入院种类、药物编号、体重、性别、出院配置。研究采用神经网络的GRNN算法,首先将归一化的458组导入输入层,从模式层可输出对应样本的权值,接着经过不断训练,在光滑因子时输出层的结果与实际再次入院率最相近,最后将其余100组数据带入训练模型得出再次入院率与指定特征变量间的函数关系。
关键词:主成分分析;径向基函数;神经网络
1 提取影响再次入院率的特征变量
1.1 主成分提取
step1:模型准备
本文中根据医院对于糖尿病的常见治疗方案得出影响糖尿病治疗效果的因素,从附件中预先选取八个影响指标,即糖尿病人的性别、年龄、体重、病人入院类型、入院来源、住院时间、使用药物编号、出院配置、注射胰岛素量,为进行主成分分析,得到可行建立评价体系的主要指标,需将附件指标进行预处理。本文中将糖尿病人的性别进行定量:男性为1、女性为0,病人每个阶段的年龄、体重取平均值,病人胰岛素用量规定:
step2:数据归一化处理
为了避免指标变量量纲的影响,需要对于变量指标数据进行归一化处理;本文去噪后数据涉及558个,指标数据9个,第j个数据的第i个指标值为Fij,数据进行标准化公式:
(1)
其中, ——指标i均值;
Si——指标i的标准差;
计算标准化数据的相关系数矩阵,求出该矩阵的特征值与特征向量。将第i个指标和相邻的第i个指标的相关系数为rij,其计算公式:
(2)
则可得出两个相邻指标的相关系数矩阵为:
(3)
2基于主成分分析的指标提取
step1:提取相关指标
主成分提取出的主要指标仍具有较强的重复性和抽象性,此时,采用相关分析的方法对于主成分提取出的指标进行处理,建立与原始数据之间的直接关联。便于后续预測算法的建立,极大程度上减少计算量。
根据原始指标对于已知的三种主成分的贡献程度提取主要影响因子,将6个主成分利用SPSS进行分析,得出成分矩阵进行分析判断:
提取方法:主成分分析法
a.提取了6个成分
根据成分矩阵,可以得到每个主成分中指标的贡献率,主成分1中,入院种类与入院来源的贡献率较高;主成分2中,住院时间和药物编号的贡献率较高;主成分3中,年龄和体重的贡献率较高;主成分4中,性别和胰岛素贡献率较高;主成分5中,出院配置的贡献率较高,成分6中,性别的贡献率较高。
step2:根据相关系数确定最终指标
样本容量为558,假设置信度水平为0.01,当样本的指标相关系数超过0.01,即认为两个指标存在显著性相关关系。因此可以在主成分分析的基础上,得出指标之间的相关性矩阵(见附录)针对主成分1,入院种类与入院类型的相关系数为0.862,两者显著性相关,保留贡献高的入院种类;同理,通过主成分分析可得出有效评价指标为入院种类、药物编号、体重、性别、出院配置。
3.再次入院率与特征变量的关系求解
3.1数据预处理
数据预处理是指在主要的处理以前对数据进行的一些处理。主要是清理异常值、纠正错误数据。在附件中,有来自美国130家医院的糖尿病患者的101766组治疗数据,由于变量较多,数据量巨大,对指标体系的建立和模型的精度均有影响,所以首先需要进行数据的预处理,对初始数据进行筛选形成新的样本集。
基于本问,我们利用Excel的筛选功能将信息残缺数据和非糖尿病人的数据清洗掉,还剩下558组数据作为样本集。
3.2广义回归神经网络模型
通过上文的指标筛选的结果,确定入院种类、药物编号、体重、性别、出院配置作为影响治疗效果的关键性指标,显然这几个特征变量能够给出对于再次入院率的影响关系。本文选取广义回归神经网络模型,通过建立神经网络训练样本,得出特征变量与再次入院率之间的网络,即给出二者之间的关系。
4.结论
1.影响糖尿病治疗效果的主要指标为入院种类、药物编号、体重、性别、出院配置。
2.得出特征向量与再次入院率之间的关系,改变指标的参数可得出病人的治疗效果改善情况。
3.通过敏感性分析,得出降低入院率从医院的药物编号和出院配置两个方面进行考虑效果更好。
符号说明
R——指标间的相关系数矩阵;
Yi——第i个主成分;
Wi——主成分Yi的贡献率;
hi——高斯径向基函数;
σ——神经网络训练平滑因子;
参考文献:
[1]刘宸.基于交互学习神经网路的仿真研究[J].电子世界,2013(04):133-134.
[2]郭欣欣.人工神经网络在住宅类房地产评估中的应用[D].北京:首都经济贸易大学,2012.
[3]司守奎,孙玺菁.《数学建模算法与应用》.北京:国防工业出版社,2011.
[4]张仕良.基于深度神经网络的语音识别模型研究[D].中国科学技术大学,2017.
[5]G·葛兰·亨利,泰瑞·派克斯.多运算神经网络单元[P].上海:CN106503796A,2017-03-15.
[6]肖特特,茅佳源.目标检测方法和装置、神经网络训练方法和装置[P].北京:CN106778867A,2017-05-31.