逻辑回归模型在医疗设备报废评估辅助决策系统中的应用
2016-09-20张骏姬慧杭州市第三人民医院浙江杭州杭州市中医院浙江杭州
张骏,姬慧(.杭州市第三人民医院,浙江 杭州;.杭州市中医院,浙江 杭州)
逻辑回归模型在医疗设备报废评估辅助决策系统中的应用
张骏1,姬慧2
(1.杭州市第三人民医院,浙江杭州;2.杭州市中医院,浙江杭州)
本文针对目前医疗设备报废主要依据使用年限和临床主观意见的现状,提出结合目前医疗设备信息化管理系统,基于多参数的报废评估辅助决策方法。利用逻辑回归模型,对有内在关联的多个因素(包括:设备采购价格、使用年限、维修次数、维修费用、售后服务情况、安全记录等)共同作用下做出的评估。并且将该评估方法应用于医疗设备的报废评估子系统中。
逻辑回归模型;医疗设备;报废评估;辅助决策
0 引言
医疗器械报废环节是医院医疗器械管理中重要的环节,目前医院设备报废除满足规定使用年限外,主要靠使用科室申请和医工部门的审核,存在较多的主观因素,缺乏科学合理的评价依据。随着医疗设备信息化管理的广泛应用,很多医院都积累了大量的医疗设备相关数据。虽然人们可以在这些数据之上进行分析和研究工作,但是进行更高层次的处理时,例如从中发现规律和模式,对如此庞大的数据进行人工处理是非常困难。同时,随着数据在日常决策中的重要性越来越显著,人们对数据处理技术的要求也不断提高,例如得到数据的总体特征以及预测发展趋势等,而这些功能对传统的管理系统来说是无法做到的。于是,人们希望有一种方法可以帮助处理这些十分繁杂的数据,从中发现有价值的信息或知识为决策服务,同时减轻工作负担。[1]
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。[2]是一种利用各种分析工具在海量数据中发现模型和数据间关系的过程,这些模型和关系可以用来做出预测。
医疗设备使用的安全性与有效性跟使用年限、工作环境、使用习惯、维护保养水平等众多因素均有关联,而医疗设备的报废除考虑设备安全性和有效性外,还需要考虑设备使用的经济效益。这些因素共同作用,决定医疗设备是否继续使用。鉴于以上原因,本文提出利用逻辑回归模型寻找其中的关系。
1 逻辑回归模型定义
逻辑回归(logistic Regression, LR)属于概率型非线性回归,它是研究二分类观察结果与一些影响因素之间关系的一种多元统计方法[3],是回归方法的一种。回归是通过具有已知值的变量来预测其它变量的值。在最简单的情况下,回归采用最简单的线性回归这样的标准统计技术。但是很多问题不是简单的线性回归所能预测的,如在用医疗设备什么时候报废更合理等很难用简单的线性模型来有效预测。因为描述这类事件的变化所需的变量太多,如产品本身设计制造因素,环境因素,使用因素,后期维修状况,经济效益等,且这些变量本身往往是非线性的,故要使用非线性的回归方法,比如逻辑回归,决策树,神经网络等。在研究过程中,本文通过比较,提出利用逻辑回归模型作为医疗设备报废评估模型的设想。
2 医疗设备报废评估系统总体结构
图1 医疗设备报废评估系统总体结构图
3 数据准备及预处理
3.1数据准备
因医疗设备的报废与众多因素有关,本文利用HIS系统中的记录,调取:医疗设备装机信息(包含设备类别、采购价格、使用年限等信息)、维修次数、年因故障停机时间、累计维修金额、单次最大维修金额、工资费用、修理用备件、常用消耗材料等信息[4],还需结合该设备是否还有零配件供应、安全事故记录、售后维修响应情况等。
3.2数据清理与集成
数据清理主要解决样本的不完整、噪声和不一致的问题,以优化样本,提高其后的挖掘过程的精度和性能。由于HIS中的维修记录并不是根据数据挖掘的要求而记录的,可能会存在某些数据的缺失,对于这类缺失的记录,可以根据数据特性可以选用以下方法进行填补:
(1)常量填补;
(2)用所有样本的均值或同类样本的均值填补;
(3)根据工作经验手工填补。[5]
而数据的集成,合并来自多个数据存储的数据,主要是为来自不同医院、不同HIS系统的异构数据进行合并处理。使数据集达到有足够多的样本分布,同时又有助于减少结果数据集的冗余和不一致,有助于提高其后挖掘过程的准确性和速度。[6]
3.3数据转换与约简
在收集到足够多的可利用的样本数据后,还需要将这些数据转换成适合数据挖掘的形式,并将这些数据约简成一个精简的数据集合。数据约简策略包括:维归约(减少所考虑的随机变量或属性的个数)、数量归约(用替代的、较小的数据表示形式替换原数据)、数据压缩(使用变换,以便得到原数据的归约或压缩表示)。
4 多参数报废评估方法的建立
逻辑回归模型的数学表达式为:
注:k-维自变量yi-实际观察到的响应变量;yi=1-事件发生;yi=0-事件未发生;Pi-第 i 个事件发生的概率(取值;在 0 到 1 之间);α-回归截距;β1,…,βk-回归系数。[7,8]
随着多参数变量不断增大,响应变量Pi也不断增大,如果选取恰当的多个因素作为自变量,令每一组自变量对应的输出概率为响应变量,利用历史数据或者预先定义的数据训练模型,就可以得到逻辑回归模型的参数。
医疗设备报废评估辅助决策具有二值性,即建议正常使用和建议报废。决定设备是否报废的因素用:使用年限、风险等级、故障频率、维修费用、维修响应时间、新设备的价格等因素。因此,本文通过建立模型训练样本,利用训练样本对模型进行训练,得到逻辑回归模型参数,然后利用该参数值来获取决策信息。
4.1逻辑回归模型训练与评估
本文利用已报废设备的历史数据,经过降噪、滤波等预处理后,进行特征提取,得到训练用的初始特征集。然后设计一种搜索策略,来寻找最佳逻辑回归模型。考虑到医疗设备的相关数据是属于数据量相对较少,并且具有一定的先验知识,因此可以选用贝叶斯统计方法评估模型。首先基于先验知识,给定待估参数一个先验统计分布,然后根据贝叶斯公式,推算出参数的后验分布,最后最大化这个后验概率,获得对应的参数值。
4.2获取报废评估值
在HRP系统或HIS系统中,根据系统中设备的相关参数,预处理后再乘以各自的权重,输入到训练好的模型中即可作出是否报废的建议。
5 结束语
在现有医疗设备信息化管理的条件下,通过利用医疗设备全寿命周期数据进行决策支持,实现医疗设备报废前进行较为科学、准确的评估,从而解决医疗设备绩效、代价、风险等互相制约的难题。对于充分发挥信息化管理的优势,提高医工的劳动价值和地位有着积极的作用。但在实施过程中可能也会面临:数据收集问题、样本选取问题、数据预处理问题、与其它系统集成问题等,需要在接下来的工作中逐步解决。
在大数据未出现之前,医院通过对内部HRP、HIS等信息系统的建设,建立了高效的内部统计报表,对医院业务发展决策起到重要作用。但是,这些数据分析只是反映了冰山一角,是不全面的,更多潜在的有价值信息往往被忽略。在大数据时代,业务部门需要以更新的视角来面对大数据,接受和利用好大数据,以创造出更大的价值。[9]以数据挖掘技术为基础决策支持系统的研究,将大幅提高医院的管理水平。[10]
[1]曾小丽,王中生.决策树算法在评估中的应用研究[J].电脑知识与技术,2009,5(25):7314-7317.
[2]韩家炜,坎伯.数据挖掘:概念与设计[M].北京:机械工业出版社,2007.
[3]王济川,郭志刚.logistic 回归模型--方法与应用[M].北京:高等教育出版社,2001.
[4]周明山,袁林.医疗设备运行中的统计与核算[J].中国医学装备,2010,7(8):29-31.
[5]杨杰,姚莉秀.数据挖掘技术及其应用[M].上海:上海交通大学出版社,2011.
[6]Jiawei Han, Micheline Kamber, Jian Pei.数据挖掘概念与技术[M].北京:机械工业出版社,2012:61-62.
[7]罗富荣,刘文彬.基于逻辑回归模型的地铁工程建设多参数安全评估方法研究[C].Proceedings of 2010 International Conference on Management Science and Engineering (MSE 2010) (Volume 4).
[8]钟金,刘文彬,杨剑锋.基于逻辑回归的滚动轴承性能退化评估[J].科技信息,2010,16:504-505.
[9]深圳国泰安教育技术股份有限公司大数据事业部群.大数据导论――关键技术与行业应用最佳实践[M].北京:清华大学出版社,2015:8.
[10]庄军,袁梅,刘侃,等.基于HIS下的决策支持系统的开发设想[J].医学信息,2005,18(3):177-181.
Application of logistic regression model in the assistant decision system of medical equipment
ZHANG Jun1, JI Hui2
(1.Hangzhou Third Hospital, Zhejiang Hangzhou; 2.Hangzhou Hospital of Traditional Chinese Medicine,Zhejiang Hangzhou)
Aiming at the current situation of the medical equipment abandoned mainly according to the service life and the clinical subjective opinion, this paper puts forward the combination of the current medical equipment information management system, based on the multiple parameters of the decision making method. Using the logic regression model, the intrinsic connection of a number of factors (including: the purchase price of the equipment, the use of period, the number of maintenance, maintenance costs, after-sales service, safety record , etc.) together to make the evaluation. And the evaluation method is applied to the evaluation subsystem of medical equipment.
Logistic regression models; Medical equipment; Scrap evaluation; Assistant decision
浙江省医院协会浙江省康恩贝医院管理软科学研究项目
项目名称: 基于数据挖掘的医疗设备报废评估研究
项目编号: 2015ZHA-KEB322