基于数据挖掘技术的医患关系管理系统开发研究
2017-09-28袁顺星李章昊左其群蒋璐
袁顺星++李章昊++左其群++蒋璐
摘要:目前,由于医患纠纷风险管理不足,医患关系的发展日益紧张。为了满足减少社会医患纠纷的迫切需求、最大程度地挖掘医患关系数据的价值,系统设计了基于C/S架构的医患关系管理系统,通过建立医患纠纷数据库,利用数据挖掘技术分析医患纠纷数据,并实现数据预处理、数据分析、同化反馈等功能。该系统能够客观地评估医患关系风险,从而助力院方科学决策,促进医患关系的和谐发展。
关键词:医患关系;大数据;数据挖掘技术;医疗数据
中图分类号:R197 文献标识码:B 文章编号:1006-1959(2017)19-0011-04 Research and Development of Doctor Patient Relationship Management System Based on Data Mining Technology
YUAN Shun-xing,LI Zhang-hao,ZUO Qi-qun,JIANG Lu
(School of Medical Informatics,Xuzhou Medical University,Xuzhou 221000,Jiangsu,China)
Abstract:At present,due to lack of risk management of medical disputes,the development of the doctor-patient relationship increasingly strained.In order to meet the urgent needs of the community to reduce medical disputes,to maximize the value of the data mining in the doctor-patient relationship,the doctor-patient relationship management system design system based on C/S architecture,through the establishment of medical dispute database,using data mining technology to analyze the data of medical disputes,and the realization of data pretreatment,data analysis,feedback and other functions.The system can objectively evaluate the doctor-patient relationship risk,thereby boosting the scientific decision-making,and promote harmonious doctor-patient relationship development.
Key words:Doctor-patient relationship;Big data;Data mining technology;Medical data
在医疗卫生条件逐渐完善的今天,医患纠纷事件却屡有发生[1],不仅对医院正常诊疗过程造成极大不便,更严重损害了医护工作者的身心健康。此外,医疗体制市场化改革[2]、医疗保险制度的不完善[3]等因素导致医患关系扭曲的结构性矛盾,严重扰乱医疗秩序,一旦发生医患冲突,现有的纠纷调解渠道却很难发挥出其应有的作用。如何缓解医患冲突、构建和谐医患关系成为当前医疗卫生领域迫在眉睫的难题。
随着信息化技术的发展,各种医院信息系统及平台得到了有效广泛地使用,然而针对医患纠纷管理的信息化[4]应用研究却很少。医患纠纷案件的发生并非毫无征兆,通过数据挖掘技术[5]可以从海量的医患数据中获取有价值的信息,从而增强医患纠纷风险管理,进而实现对医院医患纠纷事件的有效防控。为此,本文结合数据挖掘技术、数据集成技术和软件开发技术,从各式各样的医院信息系统中获取、集成医患纠纷数据资源,通过对医患关系大数据的采集与分析[6],利用数据挖掘技术提取出有用的信息,从而评估医患关系风险,为医患服务管理决策调整提供有力的参考依据,有效地监管并预防医患纠纷事件的发生。
1 数据挖掘技术概述
1.1基本概念
所谓数据挖掘(Data Mining,DM),指的是借助于人工智能技术、机器学习技术、统计学及模式识别等技术,并依托于此对数据库中所存在的大量不完全、随机、有噪声、模糊数据的统计、归纳和推理,提取出隐含的、具有潜在价值的信息,从而发现事件的相互联系,为管理者解决实际工作问题提供有效的决策支持[7]。
1.2数据挖掘的过程
图1为数据挖掘過程的展示图。如该图所示,先对数据挖掘的对象进行确定,之后对数据进行相应的预处理,以便为挖掘做好准备,然后实施数据挖掘并对抽取的信息和挖掘结果进行分析,最后进行知识的同化,将决策反馈到现有的业务系统中。
2 系统设计
2.1系统总体设计
系统主要由数据预处理模块、数据分析模块和同化反馈模块三部分构成,系统的整体架构图见图2。数据预处理模块收集医疗信息系统的原始数据并进行字段提取、清洗、装载和集成,进而形成医患纠纷数据库存储在远程服务器中。客户端软件服务平台通过访问医患纠纷数据库获取数据源,并进行医患数据的挖掘分析。同化反馈模块根据挖掘分析结果提出医患纠纷处置策略及预防方案建议,从而为医疗机构及医护工作者的医患管理工作提供有力支持。
2.2数据挖掘应用思路
对于医患纠纷管理应用数据挖掘技术的过程来说,主要包括四个步骤,即:第一步,明确对象;第二步,进行数据准备;第三步,进行数据挖掘及结果分析;第四步,进行知识的同化。医患纠纷管理应用数据挖掘技术的思路框图见图3。endprint
2.3系统功能设计
2.3.1进行数据预处理操作 将医疗机构中的原始数据库进行数据的集成、抽取、清洗和装载。在这一过程中,首先根据不同数据源的数据特征进行分析,提取转换集成关键字段,如医务人员和患者信息字段、科室机构的相关字段、医患纠纷事件的相关字段。集成完成后进行数据清洗和装载,清理其中缺少属性值的残缺数据、包含错误属性值的噪声数据及不一致的数据,而对于完整的、正确的,以及一致的这些数据信息,则把其存入至数据仓库中。
2.3.2数据总结分析 通过多维数据分析总结医患纠纷数据并对其进行紧凑描述。在此过程中,对规范化的数据进行聚类分析和离散化,获得医患纠纷事件发生的频率、时空分布和科室分布规律,从而分析在时间和空间分布上不同性质的医患纠纷事件是否具有一定的聚集性。同时,初步获得医患纠纷事件的相关敏感参数,并检测相关字段属性的异常数据点,异常点的检测能够对异常行为进行预警及医患纠纷个案分析等。
2.3.3数据相关性分析 根据挖掘目标和需求选择相关字段,使用支持度、置信度和提升度来衡量数据之间关系紧密的程度,并利用关联分析方法分析出数据之间的内在联系。如分析发生医患纠纷事件的发生与患者的性别、年龄、文化程度等基本信息,所患病症、病情状态、治疗状况、所付费用等就诊信息,负责医师、所处机构科室等因素之间是否具有实际意义的内在联系。
2.3.4结果分析与知识通化反馈 分析关联结果,选择敏感参数,运用决策树、支持向量机、粗糙集等分类和归纳方法提取数据之间的预测规则,发现容易导致医患纠纷发生的相关因素,进而对医患纠纷行为进行预测,以减少或避免此类情况的发生。通过已知的数据记录可以按照医患纠纷的相关特征实现对未来数据的推广预测。最后结合医院医护工作的实际管理过程,根据分析的结果提出有效的医患纠纷的处置策略及预防方案建议。
3 系统数据准备
3.1医患关系数据特点
与其他领域的数据挖掘相比,医患关系数据[8]有着自身的特点,即其数据的规模大、数据结构呈多样性、数据增长快速、数据价值巨大等典型大数据特性,同时也具备其独有的特点,具体包括:①多态性:多样性是医疗领域数据本身具有的显著特点,也是区分于其他领域数据最为突出的标志。医患关系数据包含纯数据、信号、文字、动画、视频、语音等多种存储形式。同时,它使探索医患关系数据变得较为复杂,也加大了数据挖掘的难度。②冗杂性:医疗数据量大且杂,涵盖内容形式多样,其中还包含重复、有误以及矛盾的数据。为此,在进行数据预处理这个阶段,需要实施数据清理工作,主要对这些数据进行清理,具体为:一是残缺的数据,包括缺少属性值的数据;二是含噪声的数据,有错误的属性值也属于这类数据;三是不一致的数据,信息相同但是表示方式不同的也属于这类数据。与此同时,还要对不同来源的数据进行数据集成,从而统一数据字段及格式,建立独立的医患数据库。③隐私性:医患关系数据一定程度上涉及到患者和医生的隐私,对于医患关系数据的挖掘需要考虑到安全性。因此,需要清除数据库中涉及到患者或医生姓名、电话、家庭住址等敏感字段,从而保证医患关系数据的隐私安全性。④社会性:大众传媒对医患纠纷事件的关注度持续升高,部分民众以偏概全、对医疗系统的整体性认识不足,医患关系数据受到的舆论和社会影响与其他数据领域截然不同。
3.2数据库设计
医患纠纷数据库的建立为数据挖掘提供数据基础,其内容和结构直接关系到挖掘结果,也是应用过程中需要首要解决的问题。基于此,先根据实际需要查阅相关文献资料,并分析医患纠纷事件发生的特点、归纳与其相关联的各种因素;进而根据分析结果制作调查问卷,并对医院各科室的过往纠纷事件进行针对性统计调查,进一步分析医患纠纷事件的特点;然后通过Delphi法[9]进行专家访谈,讨论调查及分析结果,最终确定数据库的结构。系统设计的医患纠纷数据库主要包括:医院科室机构表、医务人员信息表、患者信息表、诊疗情况表、患者认知反馈表、医患纠纷事件表等,图4是关于医患纠纷数据库的实体-关系图。
4 系统软件设计
4.1数据预处理模块软件设计
在面向数据挖掘的数据预处理过程中,主要实现对医疗机构中的原始数据库进行数据的集成、抽取、清洗和装载等操作,数据预处理模块部分功能界面效果图见图5。
为了解决医院信息系统数据形式多样、存储环境各异、无法直接共享等问题,系统选用中间件模型的数据集成技术。数据集成是将异构、分布、自治的数据在逻辑上或物理上有机地集中,从而提供全面的数据共享。而中间件模型是一个成熟的数据集成框架,系统通过建立统一的全局医患关系数据数据模型,并提供数据访问的通用接口,从而让集成医疗信息系统数据源作为统一的整体。
集成完成后進行数据集的清洗和装载,针对其中缺少属性值的残缺数据、包含错误属性值的噪声数据及不一致的数据进行清理,而直接存入完整的、正确的,以及一致的数据信息,从而构建医患关系数据挖掘的数据仓库。
4.2数据分析模块软件设计
数据分析模块利用开源数据挖掘工具WEKA(Waikato Environment for Knowledge Analysis)进行二次开发。WEKA是是Waikato大学研究的开源数据挖掘平台,该平台集成了面向数据挖掘过程的大量机器学习算法,实现对数据预处理、数据关联性分析、数据分类和聚类等功能。系统通过基于WEKA工具的二次开发,实现获取医患关系数据,对数据的聚类分析、对医患纠纷事件发生的频率、时空分布和科室分布规律进行分析,检测相关字段属性的异常数据点及医患纠纷个案分析,利用关联分析方法分析出数据之间的内在联系等功能。数据分析模块部分功能界面效果图见图6。
5 总结
本文探索并设计了数据挖掘技术在医患关系的管理中的应用,实现了医患关系的数据集成、数据分析和预测反馈。在将数据挖掘技术应用在医患关系管理的过程中,充分有效地利用了海量的原始医疗信息化数据,并从中发现数据的内在关联和具有潜在价值的信息,从而辅助医患关系管理的决策过程,具有一定的应用价值。然而,在实际应用过程中还存在一些难题,如医患关系数据数量不大且质量有待提高,医患纠纷案件评价指标不够完善等,尚需进一步解决。
参考文献:
[1]陈丞,漆小凤,刘梅英.新时期医患纠纷引发暴力事件原因分析及防范对策[J].大家健康,2015(1):564.
[2]芦兰,师幸伟.关于我国医患关系现状的思考[J].医学争鸣,2016(3):66-70.
[3]母玉清.我国医疗保险制度发展的历程、现状及趋势[J].中国初级卫生保健,2016,30(2):16-17.
[4]刘华.医疗纠纷的信息化之路-专访北京协和医院医务处副处长刘宇[J].中国数字医学,2014,9(6):118-119.
[5]丛晶,杨波,王乙红.等.数据挖掘在医疗质量安全监控系统应用的可行性研究[J].中国医院管理,2013,15(2):386-388.
[6]高汉松,肖凌,许德玮,等.基于云计算的医疗大数据挖掘平台[J].医学信息学杂志,2013,34(5):7-12.
[7]刘小华,胡学钢.数据挖掘的应用综述[J].信息技术,2009,33(9):149-152.
[8]缪春玉.医患纠纷数据库的研制[D].第三军医大学,2012.
[9]缪春玉,张绍蓉,曾琴,等.德尔菲法构建医患纠纷数据库的研究[J].重庆医学,2012,41(12):1234-1235.
编辑/成森endprint