APP下载

DRGs数据质量智能控制系统研究

2018-07-19李正梅徐金龙王思琪张新波张哲军魏凌云

现代医院 2018年6期
关键词:数据模型病历本体

章 莹 李正梅 徐金龙 王思琪 张新波 张哲军 魏凌云

住院病案首页是DRGs分组数据来源,是医务人员使用文字、符号、代码、数字等方式,将患者住院期间相关信息提取汇总在特定的表格中,形成的住院病历数据摘要。2014年国家卫生和计划生育委员会发布的卫生行业标准《电子病历基本数据集第10部分:住院病案首页》[1]规定了133个首页数据元名称、定义及填写要求等。大量调查研究显示,首页数据完整率为29.53%~99.9%,规范率为86.21%~86.55%[2-4]。虽然相关研究较多,但是因缺乏统一数据质量模型,研究结果难以比较。而首页数据是DRGs及基于DRGs的支付机制、医疗质量管理、公共卫生监测的基础数据来源,首页数据质量控制与持续改进具有重要的实践价值。本研究研习HL7 CDA[5]、open EHR[6]、《病历书写基本规范》(2010 年版)、《电子病历基本架构与数据标准(试行)》[7]等资料,构建首页数据模型、数据质量本体,开发数据质量智能控制系统,建立质量数据驱动DRGs数据质量持续改进的自适应PDCA循环。

1 资料与方法

1.1 资料来源

1.1.1 数据模型 数据模型参考HL7、open EHR、《电子病历基本架构与数据标准(试行)》以及病历书写范例等。范例选取某三级甲等妇幼专科医院的妇、产、儿科电子住院病历和《医疗文书书写规范与病案管理》[8]病历范本。

1.1.2 数据知识本体 数据知识来源包括《电子病历基本数据集第10部分:住院病案首页》[1]、《医院管理学:病案管理分册》[9]、澳洲[10]、美国[11]、CMS[12]等的code Edits要求及从日常的质量数据中挖掘的规则等。

利用Protégé 5.0.0,以本体建模方法和知识表示的标准和交换协议建立首页领域本体概念树和知识表示[13- 14],部分首页领域本体片段见图1。首页数据元以一体化医学术语系统(Unified Medical Language System)概念标识符(Unique Identifier for Concept,CUI)进行概念标记。利用Jena推理机对初始本体的结构、一致性和隐含知识进行检查评估,修正和完善首页本体结构及关联知识。

图1 首页领域本体片段

1.2 评估方法

1.2.1 智能PDCA系统 PDCA循环,是指在管理活动中,为提高系统质量,所进行的计划(Plan)、执行(Do)、检查(Check)和行动(Action)等的阶梯式循环。本研究将数据质量要求转换为标准化、形式化的知识表示,如规则、案例、本体等,建立“智能+”质量控制机制,并逐步延伸智能化的广度和深度。以知识和数据驱动,辅助专业人员在线进行质量控制和数据分析,反馈数据责任人,强化实时预警与持续改进。

系统平台功能模块包括:系统开发管理平台、基础数据字典平台、质量规则维护平台、病历首页数据质量查询平台、病历首页数据质量审核平台、用户交互平台。平台开发语言为ABAP,合并了通常的控制结构和模块化概念,实现了和其他编程语言的合成,如VB,JAVA,C/C++等。所有ABAP程序驻留在SAP数据库中,ABAP的一个关键组件是数据库接口,接口代表ABAP程序处理与关系数据库的所有通信。系统模块架构图见图2。

图2 系统模块架构图

1.2.2 数据质量维度 将首页数据质量缺陷定义在缺失、有效性、完整性、唯一性、正确性、一致性6个质量维度,并限定各质量维度不分层次,质量维度涵义不交叉,数据的质量评估结果不允许维度重复。

1.2.3 数据权重分配 基础权重按乘法模型计算加权平均值,体现数据元、数据组和文档段的组合及其综合重要度,权重分值的“1”、“3”、“5”、“7”、“9”分别对应“不重要”、“较不重要”、“一般重要”、“较重要”、“非常重要”,“2”、“4”、“6”、“8”表示介于相邻重要度之间,无法准确判断的情况。公式如下:

数据元综合重要度:I数据元综合=I临床文档×I文档段×I数据组×I数据元

数据元权重:R数据元=I数据元综合/∑I数据元综合

在基础权重基础上,依据质量缺陷发生概率,利用风险矩阵对权重值进行动态调整。质量权重依管理需求自适应循环迭代,促进数据质量的持续改进。若无历史数据,系统以初始值冷启动。

1.2.4 质量信息模型 首页数据质量分析以质量信息模型为依据,参考《住院病案首页数据质量管理与控制指标(2016版)》[15]和美国NQF(National Quality Forum)开发数据质量信息模型(QDM,Quality Data Model)[16],建立数据质量评价指标。

1.2.5 统计分析方法 使用系统的统计、查询平台(集成了R 3.2.5API)对首页质量数据进行统计处理,利用数据可视化技术建立视觉化、直观化的质量评估报表、统计图表等,着重重点问题、重点责任人、变化趋势分析。预定义质量报告文本结构,自动获取统计结果、图表,自动生成数据质量图文报告,向评价机构或第三方监管机构等反馈数据质量评估结果和报告。

2 结果

2.1 数据模型

2.1.1 电子病历数据模型 建立四层电子病历数据模型[7],具体如下:第一层为临床文档,指代特定医疗服务活动(卫生事件)产生和记录的患者临床诊疗和指导干预信息的数据集合。如:入院记录、住院病案首页、首次病程记录等。第二层为文档段,主要参考HL7 RIM _ACT、open HER _ENTRY分类,将文档段分类为文档头(文档标识、服务对象标识、事件摘要等)、观察(体格检查、症状、体征等)、评估(预后、死亡、疾病风险、医疗质量评估等)、诊疗(诊断、用药、手术/操作、其他治疗等)、指导(诊疗计划、指示建议等)、医学检验检查、沟通、财务行为、管理行为共9类。其中病历书写规范所要求填写的内容,保留其书写规范要求名称,并用下划线分隔符与文档段分类相连,例如“现病史_医学检验检查”、“体格检查_观察”等。第三层为数据组,作为一个数据元集合体构成临床文档的基本单元,具有临床语义完整性和可重用性特点。数据组是对文档段更细的划分,一般来说,文档段对应的数据组基本固定。应用参考信息模型(RIM)实现数据组的组成、约束以及实例化管理。第四层为数据元,位于电子病历数据结构的最底层,是可以通过定义、标识、表示和允许值等一系列属性进行赋值的最小、不可再细分的数据单元。

2.1.2 住院病案首页数据模型 首页133个数据元依据电子病历数据模型进行分析,其中,临床文档层主要摘取自病历概要、出院记录、入院记录、手术及操作记录等;文档段层,分为文档头、观察、诊疗、评估、医学检验检查、财务行为共6类;数据组层,扩展为诊断、手术、操作、服务对象标识等共计21类。基于电子病历构建的首页数据模型,具备较强的稳定性与通用性。

2.2 系统评估

本系统自2017年起在某三级甲等妇幼医院进行实测应用,以该院2016年首页质量数据作为系统权重初始赋值。经实测发现,系统应用后,首页数据质控的效率和数据质量均有较大改进。

2.2.1 质控工作效率提高 2017年使用数据质量智能控制系统实现首页质控61 352例次,质控率100%,及时质控率100%。质控数、质控率、质控及时率分别较 2016年提高106.68%、83.06%、140.58%、12.22%。因系统可设置在非工作时间进行质控或实时质控,不另行占用信息管理人员工作时间,因此每年可节约人力618.44人·天,质量数据分析处理的时间也由每年60人·天,缩短为12人·天,缩短了80%。质控工作效率具体比较情况见表1。

2.2.2 数据质量改进 2017年系统共计发现首页数据缺陷112 274个,平均缺陷为1.83个/份,缺陷率较2016年降低28.52%。首页数据缺陷依次为主要诊断未依据ICD-10填写、诊断与性别不一致、主任医师-缺失、主治医师-无效、手术分级-缺失等。数据质量智能控制系统Pareto图见图3,雷达图见图4,报表见图5。

2017年因本系统的应用,DRGs分组数据的质量和分组结果均有一定的改进,其中首页填写合格率由83.54%提高至93.75%,提高了12.22%。分组关键数据主要诊断准确率和主要操作准确率分别由69.88%提高到85.35%、83.54%至93.54%,分别较2016年提高了22.14%和11.97%。 MDC13组的费用RIV由2016年的70.30%提高至76.10%,提高了8.25%。DRGs 分组一致率由65.20%上升至97.59%,提高了49.68%。首页数据质量变化情况见表2。

表1 质控工作效率比较情况

注:1)可设置在非工作时间进行质控或实时质控,不另行占用工作时间

表2 首页数据质量变化情况

图3 数据质量智能控制系统pareto图示例

图4 数据质量智能控制系统雷达图示例

3 讨论

3.1 DRGs数据质量智能控制系统的技术及评价

我国首页数据质量研究仍处于初期探索阶段,相关研究结果显示[17-18]首页数据质量问题集中于诊断、手术操作信息错误,患者信息采集不准确不完整等问题,数据质量问题将导致DRGs分组研究的结果不够理想[19]。本研究提出“智能+”技术集成战略思路,研发DRGs数据质量持续改进的自适应PDCA循环系统。

研究考虑数据模型在未建立的情况下,质量分析结果差异较大,导致质量评估体系不具备系统性、稳定性和通用性,若首页数据元变动后,评估模型亦需随之变动。本研究参照HL7 CDA、《电子病历基本架构与数据标准(试行)》等资料,建立以电子病历数据标准为基础的首页数据模型。

科室质控数缺陷总体情况缺陷数缺陷数/份条目分析文档头财务行为观察诊疗评估医学检验检查缺陷条目数缺陷条目数/份缺陷条目数缺陷条目数/份缺陷条目数缺陷条目数/份缺陷条目数缺陷条目数/份缺陷条目数缺陷条目数/份缺陷条目数缺陷条目数/份妇科(院区1)1001361.36120.1200.0000.001161.1630.0350.05妇科(院区2)374612.460.1600.0030.08300.8170.1900.00产科(院区1)1552091.35380.2500.00210.141240.80150.10110.07妇科(院区2)3724821.30520.1410.00450.123370.91200.05270.07妇产科系列合计6648731.311080.1610.00690.106070.91450.07430.06

图5数据质量智能控制系统报表示例

研究应用知识本体、数据质量本体等前沿技术实现首页数据质量的智能评估。本体(Ontology)定义为 “共享概念模型的明确的形式化规范说明”[13],通过研习首页数据元定义及相关质量要求,建立首页数据领域本体,提高数据知识的通用性、重用性[20]。数据质量(Data Quality)是指信息“符合要求的程度”[21],数据质量的层次框架[22]分为内在数据质量,上下文数据质量,表达数据质量,可访问性数据质量4类。参照数据质量层次概念,定义首页数据6个质量维度,全面评估数据是否“符合要求”。在此基础上,应用数据质量本体(Dada Quality Ontology)[23-24],规范数据质量维度定义与规则,建立数据质量测量的标准流程(Measurement Model),与领域本体推理目的、方式和计算类型进行映射,评价领域数据质量,获得自动化、精细化数据质量评估结果(Measurement Result)[25]。

另外,系统利用组合权重分配机制,结合历史数据为依据的半定量风险评估方法,科学评估质量数据结果,逐步分离“评价机构”的关键性风险因素,以辅助后续对改进措施的研究,有效提高首页数据质量控制模型的动态化、特性化管理能力。

系统的运行结果说明,“智能+”控制系统不仅可以提高质控工作效率,可持续改进首页数据质量,有效提高DRGs分组效果。

3.2 数据质量智能控制的发展方向

本研究中的数据模型、数据质量本体具有较强的通用性,提供病历质量控制、医疗质量控制乃至公共卫生质量管理的重要借鉴方法。今后本团队将在此基础上,运用失效模式及后果分析(Failure Mode and Effect Criticality Analysis)、根本原因分析(Root Cause Analysis)等质量管理工具,对关键质量问题进行分析,了解问题深层原因和本质。以质量问题根本原因启发思维转换,发现潜在可用资源,评估解决根本问题的可能性,根据问题的性质选择合适的解决技术进行求解,例如质量屋(Quality Function Deployment)技术,TRIZ创新原理算法等。通过质量数据驱动的质量改进措施分析,对不同责任部门、责任人进行特性化分析,对数据产生过程进行预测,为数据优化设计提供决策依据。建立有效的过程管理工作机制、奖惩机制,维持和管理改进的过程和成果,让“评价机构”切实做到首页数据质量持续改进。

猜你喜欢

数据模型病历本体
强迫症病历簿
眼睛是“本体”
“大数的认识”的诊断病历
面板数据模型截面相关检验方法综述
基于本体的机械产品工艺知识表示
为何要公开全部病历?
经济全球化对我国劳动收入份额影响机制研究——基于面板数据模型
村医未写病历,谁之过?
专题
Care about the virtue moral education