基于主成分分析的糖尿病治疗模式评价体系
2019-04-04高禹
高禹
摘 要:控制住院病人的血糖水平对降低发病率和死亡率具有重要作用。为了提高患者的安全性,有必要对现有的医院收治的病人的糖尿病治疗模式进行分析评估。本文根据Ⅱ型糖尿病医疗效果评价指标体系概念框架,從相关数据中筛选出与糖尿病医疗效果有关的十一个指标,再对这些指标进行皮尔逊相关性分析,合并或删除三个相关指标,最后对余下的八个指标进行主成分分析,将提取的三个主成分列为一级指标,剩下的若干指标列为二级指标,建立起适合本文的糖尿病医疗效果评价指标体系。
关键词:糖尿病治疗模式;主成分分析;评价体系
引言
为了提高患者的安全性,有必要对现有的医院收治的病人的糖尿病治疗模式进行分析评估。本文根据来自美国 130 家医院的糖尿病患者的治疗数据,利用数学建模的方法,对医院对糖尿病的治疗模式进行评估,同时建立相应的数学模型和算法,分析确定合理的评价指标体系,用以评价医院对糖尿病患者的治疗效果。
1 .指标体系的建立
本文建立的糖尿病医疗效果评价指标体系见表1。
2 . 模型求解
Step1:根据医学上的Ⅱ型糖尿病医疗效果评价指标体系概念框架,从 数据 中 筛 选 出 与 糖 尿 病 医 疗 效 果 有 关 的 评 价 指 标 。
Step2:筛选出的 11 个指标,两两之间可能存在相关性。在统计分析中,变量与变量之间是相互独立的,所以通过皮尔逊相关性分析,计算出变量之间的相关性系数, 并根据相关性系数合并或删除相关变量。
Step3:对筛选出的指标进行主成分分析。筛选出的指标均为成本型指标,所以直接对数据进行标准化处理。对标准化处理的数据,计算其相关系数矩阵R,之后计算相关矩阵R的 11 个特征值。
在求得的 11 个特征值中,选取λ >1的三个特征值作为主成分,其中λ = 1.63,λ= 1.374,λ= 1.1046。根据公式可以求得这三个特征值所对应的方差贡献率分别为 20.381%,17.175%,13.071%,累积方差贡献率为 50.627%<80%,所以这三个主成分只是将这 8 个指标粗略的划分成住院医疗费用,门诊医疗费用,病症分析指标这三个部分。累积方差贡献率虽然不高,但是整个主成分分析是基于已知的Ⅱ型糖尿病医疗效果评价体系概念框架之中,并且建立在庞大的样本(十万组数据)之上, 所以建立起的新的评价指标体系在大的方向上不会有太大的变化。
如果没有Ⅱ型糖尿病医疗效果评价体系概念框架,就需要提取至少 5 个主成分(提取率>73%),对这 8 个指标进行一次细致的划分。最后需要依据建立起的评价指标体系计算综合得分。在此之前需要借助主成分矩阵求出主成分得分系数,再利用主成分得分系数求出该病人在各个指标下的得分情况,之后根据方差贡献率(权重)求出该病人糖尿病医疗效果的综合得分。最终的医疗效果依据综合得分进行评价,因为 8 个指标均为成本型指标,所以综合得分越低,医疗效果越好。
3 .模型检验
对新建立的糖尿病医疗效果评价指标体系的检验结果如表2所示,KMO系数为0.597>0.5,也就是说通过主成分分析建立起的糖尿病医疗效果评价指标体系是没有问题的。巴特利特球形度检验的显著性值为0<0.05,这证明该体系也可以通过因子分析进行建立。
在数据预处理的过程中发现,AlCresult(糖化血红蛋白检测结果) 等指标出现了数据缺失问题,糖化血红蛋白检测结果的完整度不足 1/7。在模型建立的过程中,对缺失数据进行了取平均值的处理,所以综合得分与实际值之间是存在偏差的。同时在计算特征值和方差贡献率的时候存在四舍五入的情况,这也会使得最终的综合得分与实际值之间存在偏差。
结论:
本文建立模型简单便于对患者的医疗效果进行评价,模型建立在标准的评价体系概念框架之内,在指标的选用和指标的分类上不会出错。但该模型的累积方差贡献率较低,对样本信息的提取度较低,对指标的划分较粗略,这是模型以后需要改进的方向。
参考文献:
[1]刘新建, 何兰杰. Ⅱ型糖尿病医疗结果评价方案的系统分析[J]. 科技管理研究, 2009, v.29;No.v.29(8):108-110.
[2]龚志民,马知遥.计量经济学[M].北京:清华大学出版社,2017.