APP下载

基于PCA-SVM算法的医院和患者行为选择的演化分析

2018-06-23张金鑫湖北大学商学院湖北武汉430062

丝路艺术 2018年3期
关键词:低质量医患高质量

张金鑫(湖北大学商学院,湖北 武汉 430062)

尤瑞(荆门市财政局,湖北 荆门 448000)

当前医疗卫生数据呈现种类多、数量大、特征混杂等特点,为数据挖掘分类带来一定的挑战[1]。同时,信息的高度不对称是医患双方的重要特征[2]。医疗卫生领域的信息不对称主要体现在患者对医疗信息很难掌握、对医疗服务质量和数量缺乏必要的了解,同时也无法准确的事先预知[3]。

本文利用PCA-SVM对海量的医疗卫生数据进行降维,用降维后的数据进行训练,用最好的分类器对患者疾病指标进行准确的预测,这样不仅使患者对自己的病情有一个基本的了解,还避免了挂错号的情况、缓解了医患信息不对称的问题。然后通过医患演化博弈模型分析,并给出一些相应的建议。本文主要分为以下几个部分:第一部分主要是介绍PCA-SVM算法模型;第二部分是医患演化博弈分析;第三部分是对本文的总结以及一些相应的建议。

一、PCA-SVM算法模型

大数据背景下,数据挖掘在医疗卫生领域的应用越来越广,尤其是通过PCA(主成分分析法)将数据进行降维,主要集中在医学质量管理、药物的研发以及辅助诊断方面。近几年,SVM(支持向量机)、人工神经网络(ANN)、K-means(k-均值聚类算法)已经用在疾病的预测上。如SVM用于诊断缺血型心脏病、SVM和鉴别集的结合可以诊断老年痴呆、ANN算法用于进行动脉抽样硬化和心血管疾病的早期预防[4]、利用k-means算法和SVM算法的结合去诊断乳腺癌[5]等。但是,对于海量的数据,有些数据可能对我们的实验作用不是很大,反而在进行数据处理时加大了难度,所以就要先进行数据清洗和数据预处理。数据预处理的方法主要有:数据集成、数据清理、数据选择、数据特征降维等。本文运用PCA首先对海量的医疗数据进行降维,然后使用SVM对选择的特征进行有效地训练,最后对患者的疾病进行精确地预测。

(一)利用PCA对数据进行预处理操作

假设有N个病人的某种疾病样本,每个样本有P个疾病指标,这些诊断指标很多,进行有效地降维操作,可以提高数据处理效率。进行主成分分析的步骤主要有:

(1)原始数据的标准化

现在有原始样本矩阵 X=(Xij)n×P,i=1,2,…,n,表示 n 个病人样本,j=1,2,…,P,表示每个样本都有P个指标,Xij表示第i个病人的第j项指标值。

对原始数据进行标准化变换,使用Z-score法,变换公式如下:

其中,为病人样本数据的均值,为病人样本数据值得方差,i=1,2,…,n;j=1,2,…,p。

(2)指标数据的相关矩阵

计算主成分要从相关矩阵出发,有时候数据较多,如果各个指标的物理量纲不同,较为合理的方法就是计算相关矩阵。相关矩阵的计算公式如下:

(3)根据相关矩阵提取主成分

由特征方程式 λIp-R =0,可知p个特征值。而且将这p个特征值按照从大到小的顺序排列,λ1≥λ2≥λ3≥…≥λp,每一个特征值λi对应一个特征向量ti(i=1,2,…,p)。

在此,可以用标准化过的变量表示主成分,

这里F1,F2,FP分别就是第一主成分、第二主成分、第p个主成分。

主成分的主要目的就是变量的降维以及对主成分的解释。对高维的变量空间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合将尽可能多的保留原来指标变量方面的信息。

一般情况下,我们提取k个主成分(k<p),提取的主成分个数k由方差贡献率来确定,一般认为,方差累计贡献率来确定。

(4)主成分回归

在建立回归分析模型时,如果自变量之间存在多重线性问题,将会使得回归模型非常不理想,有时会使得明显存在线性关系的两个变量之间模型计算出来没有关系。利用主成分的互不相关性来建立因变量与主成分的回归,在理论上可以消除自变量的多重共线性问题。

设Y是一个随机变量(因变量),X=(X1,X2,…,Xp)’为一个p维的解释变量。

由以上问题已经求得主成分,建立因变量与主成分之间的回归模型:

最终将公式(6)带入公式(7)得到因变量Y与自变量X之间的回归模型。

(二)利用SVM对病人数据样本进行准确预测

SVM算法最初是由Vapnik等人在1995年提出的一种可训练的机器学习算法。依据统计学习理论、VC维理论和结构风险最小化理论,从一定数目的样本信息在学习能力和复杂度中找到折忠,以期获得最好的推广能力[6]。

SVM算法的基本步骤:

(1)数据集的准备:把原始数据集分为训练集和测试集以及训练集标签和测试集标签。

(2)选择适当的核函数:常用的核函数主要有:线性分类器、多项式核函数以及径向基核函数。

(3)带入训练集样本得到SVM模型分类器。

(4)训练得到较好的分类模型,然后对PCA处理过的数据集进行挖掘分析。

(5)将患者的一些疾病指标样本输入SVM,最终得到疾病的预测结果。

面对海量的医疗数据,有时维数较高,处理起来会十分不便,有些数据特征并不能对数据挖掘的结果起到积极的作用。PCA可以很好地对数据进行降维,去除那些对数据挖掘不重要的数据特征,有利于数据挖掘工作,提高了数据挖掘的质量和效率。SVM根据预处理后的训练样本训练得到数据挖掘模型,通过调节参数得到最优的算法模型。综合运用PCA和SVM可以对医院的患者信息进行筛选及预测,这样就可以让医院在解决医患纠纷的博弈中占据信息的优势。

二、不完全信息医患演化博弈模型构建与求解

(一)模型假设

(1)博弈方:假设博弈的一方为智能推荐系统推荐的医院,而另一方为患者。

(2)策略:推荐系统推荐的医院可以提供高质量的服务,也可以提供低质量的服务,医院的的战略空间为{提供高质量的服务,提供低质量的服务};

患者对于推荐的医院的服务可以选择就诊也可以选择替代,所以患者的战略空间{就医,替代},所谓的替代并不是患者有病不去治疗,而是患者没有选择智能系统推荐的医院进行就诊,选择了其他的医院进行就诊。

(3)收益矩阵

信息不对称情况下,患者对智能医疗推荐系统的医院并不了解,医院可以选择提供高质量的服务也可以选择提供低质量的服务;提供高质量的服务的医院是指,医疗设备齐全、先进,专家技能高超,服务范围全面的一些中心医院、地市级医院;而提供低质量的服务的医院是指那些医疗设备不齐全,专家人数少,医护服务差,提供的服务范围窄的社区医院。假设医院提供高质量的服务的概率是y(0<y<1)。当医院提供高质量的服务时,收益为π1,政府给予的资金支持为H1,医院的运营成本为C1;当医院提供低质量的服务时,收益为π2(π1>π2),政府给予的资金支持为 H2(H1>H2),医院的运营成本为 C2(C1>C2)。

假设患者接受智能医疗推荐医院的概率为x(0<x<1),患者接受智能医疗推荐医院的服务进行就诊时,付出的医疗费用为F,医保报销比例为P(0<P<1),所以患者实际支付的医药费用为F(1-P),当患者接受医院提供的高质量服务就诊时获得的效用为V1,由于患者接受了高质量的服务时就相当于接受了专家的治疗,不仅消除了心理上对医疗水平的质疑,而且患者得到了及时的治疗,增强了患者对医院的满意程度,所以V1>F(1-P);当患者接受医院提供的低质量的服务就诊时获得的效用为V2,由于患者接受低质量的服务时,不仅看不好病,拖延时间,而且使得患者对医院的评价降低,患者会采取投诉的策略,这时,患者投诉成本为C3,投诉导致医院的损失为L;假设患者不接受医院的服务时用其他形式代替的效用为0。

根据以上假设,可以得到医患双方的收益矩阵,如表1所示:

表1 医患双方的支付矩阵

(二)模型求解

(1)患者演化稳定策略分析

根据上述医患博弈模型,U11、U12、U1分别表示患者接受医院提供的服务就诊时获得的效用、患者不接受医院提供的服务时用其他的形式代替的效用以及平均效用。

患者的复制动态方程为:

令解得x1*=0,x2*=1,

根据微分方程的稳定性定理,演化稳定策略可以表述为,在稳定状态下,满足

由公式(8)、(9)分析患者博弈的演化稳定策略如下:

当y=y*,恒等于0,则对于所有的x都是稳定状态。

当y≠y*,时,x1*=0,x2*=1都是x的两个稳定状态点,需要分情况讨论:

情况1:若则y*<0,y > y*成立,

所以x2*=1是稳定平衡点。

情况2:若分两种情况讨论:

(Ⅰ)y < y*时,所以x2*=1是稳定平衡点;

(Ⅱ)y < y*时,所以x1*=0是稳定平衡点。

上述几种情况的x的变化的相位图和稳定趋势如下图1所示:

图1 患者策略的复制动态相位图

(2)医院演化稳定策略分析

同理,医院提供高质量的服务时的效用U21、提供低质量的服务的效用为U22、平均效用为U2,表达式如下:

令解得y1*=0,y2*=1,

根据微分方程的稳定性定理,演化稳定策略可以表述为,在稳定状态下,满足

由公式(10)、(11)分析医院博弈的演化稳定策略如下:

当x=x*,恒等于0,则对于所有的y都是稳定状态。

当x>x*,y*=1是ESS均衡点。

当x<x*,y*=0是ESS均衡点。

上述3种情况的y的变化的相位图和稳定趋势如下图2示:

图2 医院策略的复制动态相位图

(3)策略动态演化趋势分析

情况1:当x*<0时,即C1-C2<H1-H2,政府给予医院的资金支持增加额能够弥补医院的运营成本增加额,此时,最优均衡为(1,1),也就是说医院提供高质量的服务的策略,患者选择就诊策略。

情况2:当0<x*<1时,即C1-C2>H1-H2,且此时,政府给予医院的资金支持增加额已不足以弥补医院的运营成本增加额,但是医院提供高质量的服务所获得的的收益增加额使得医院能够获得一定的利润。均衡点是(0,0)和(1,1)也就是医院采取提供低质量的服务策略,患者选择替代的策略;医院选择提供高质量的服务的策略,患者选择就诊策略。

情况3: 当x*>1,即C1-C2>H1-H2,且时,政府给予医院的资金支持增加额已不足以弥补医院的运营成本增加额,并且医院提供高质量的服务所获得的的收益增加额不能使医院能够获得一定的利润。此时,均衡点为(0,0)也就是说医院选择提供低质量的服务策略,患者相应的选择替代策略。

三、结论及建议

本文先采用PCA-SVM对患者的病情进行预测,推荐相关的医院给患者,然后再用演化博弈理论对医患关系进行分析,为了引导医院提供高质量的服务,患者及时的进行就诊,提出了如下建议:

(1)在医疗智能推荐系统使用过程中,政府应该根据医院提供的质量服务所带来的利润的增加额来适当调整对医院提供高质量的服务的资金支持力度。

(2)政府部门应当鼓励医院提供高质量的服务,加大对医院的资金支持,增加患者医疗报销比例,使患者看得起病、能放心看病。

(3)为了合理的配备医疗资源,让患者有病及时就诊,政府部门应该尽快落实分级诊疗制度,加强基层医疗卫生人才队伍建设;大力提高基层医疗卫生服务能力;全面提升县级公立医院综合能力;整合推进区域医疗资源共享;加快推进医疗卫生信息化建设,加强医患信息交流以缓解信息不对称的情况。

[1]戴炳荣,王晓丽等.一种基于PCA-SVM的医疗卫生数据挖掘分类方法[J].计算机应用与软件,2016,33(8):67-69.

[2]王勇等.再论医患关系博弈模型[J].重庆大学学报,2006,29(6):135-139.

[3]朱效永.信息不对称下的我国医患关系博弈模型分析[D].对外经贸,2011,210(12):129-130.

[4]田宇驰,胡亮.基于SVM的一种医疗数据分析模型.东北师大学报,2015,47(1):77-81.

[5]Bichen Zheng,Sang Won Yoon.Breast cancer diagnosis based on feature extraction using a hybrid of K-means and support vector mechine algorithms.Expert System with Applications,41(2014):1476-1482.

[6]魏振.基于GPU的SVM算法在入侵检测系统中的应用[D].长春:吉林大学,2013.

[7]弓宪文.信息不对称下医患关系博弈分析.重庆大学学报.2004,27(4):126-129.

[8张炎亮等.基于演化博弈的远程医疗服务推广策略分析.科技管理研究.16(2017):224-228.

[9]申笑颜.基于演化博弈的医疗服务费用控制监管分析[J].数理医药学杂志.2012,25(2):244-246.

[10]汪祥松等.远程医疗背景下社区医院和患者行为选择的演化分析.2015,20(2):130-137.

猜你喜欢

低质量医患高质量
坚持以高质量发展统揽全局
高质量项目 高质量发展
牢牢把握高质量发展这个根本要求
低质量实用新型专利申请授权对经济秩序的影响
“三部曲”促数学复习课高质量互动
低质量的婚姻不如高质量的单身,是真的吗?(一)
破解学前教育低质量现象
阈值随机共振及其在低质量浓度气体检测中的应用
一句“咱妈的病”让医患成为一家
解开医患千千结