APP下载

基于监管视角下的区域卫生信息平台数据质量评估指标的初步探索

2019-10-09张立新陈桂玲孟布库

电子技术与软件工程 2019年17期
关键词:字段流程评估

文/张立新 陈桂玲 孟布库

1 数据质量评估指标的背景

“十三五”之前,医疗信息化建设的重点正在从业务子系统建设转向全面应用建设。医院或区域医疗卫生信息平台建设的动力,既来自医院自身业务发展到一定阶段后产生的实实在在的需要,也来自政府政策的大力倡导。国家卫计委2014年制定的4631-2工程,以电子病历和医院管理为重点的医院信息平台建设,以居民健康档案为核心的区域卫生信息平台建设目标。

2016年10月,发布《“健康中国2030”规划纲要》;以及《省统筹区域人口健康信息平台应用功能指引》及《医院信息平台应用功能指引》等文件,都在加大对健康信息平台建设的引领和推进。

区域医疗卫生信息平台建设的实际情况,碰到了很多问题,现实比较令人失望。平台建设遇到的问题具体可以分为:

(1)建设效果不佳,因为数据质量差和及时性差,系统本身的稳定性或交互性差,导致平台很多情况下应用效果差,甚至无法应用。

(2)上传到平台的数据漏传多,导致使用者抱怨甚至弃用;

(3)平台上的患者信息与临床文档关联不上或错误关联,导致用户使用效率低下甚至最终弃用,等等。

如何运用信息化手段来提高数据质量,建立长效管理机制,保障相关软件系统的健全性、功能的完备性和运行的稳定性,减少由于系统错误、误差造成的数据质量问题。通过信息化思维和手段严把数据入口关,在业务流程中规范数据采集行为,确保入库数据确保数据的及时性、完整性和准确性。根据数据标准制定采集规则,对不符合数据规则的数据及时提醒和拒绝保存。关联的数据之间,实行联运控制,确保数据的固有质量。本文通过呼伦贝尔区域医疗信息平台数据质量工作实践,探索建立区域性的医疗机构上传数据的质量评估指标,为从事相关的人员提供一定的借鉴和参考。

2 评估指标的目标的和内容

2.1 建立评估指标的前提条件

本文假定已完成如下准备工作:

(1)各个接入区域平台的医院已准备好前置机,且已部署采集程序,与区域平台的数据中心的网络已联通。

(2)按照区域医疗卫生数据采集接口接入指南文档要求,完成相关字典的对照工作,通过采集程序定时向前置机上传诊疗业务数据类似的接口表以图1:接入模型图为基础,并加入实际发生的业务数据表。

(3)每张接口表的必填字段按照一定的权重赋予相应的分值,区域平台的数据抽取工具按规则定时将各个接入医院的数据从前置机抽到区域数据中心。

图1接入模型图:

图中每一个方块条目代表一张实体模型,其中实体之间实线连接线表示实体之间有强制关联关系,虚线连接线表示无强制关联关系,但包含业务逻辑上的关联关系。

1.2 建立评估指标的目的

随着接入平台的医院数量的增加,上传的业务数据参差不齐,“非标准数据”、“空数据”、“脏数据”严重影响了平台的各类应用。数据质量管理是循环管理过程,其终极目标是通过可靠的数据,提升数据在使用中的价值,建立一定量的指标可以评价接入医院的目前工作状况,为提高数据质量工作指明需要重点解决的问题。

1.3 建立评估指标的理论依据

影响数据质量有多方面的因素:

主要有:信息因素、技术因素、流程因素和管理因素。

信息因素:产生这部分数据质量问题的原因主要有:元数据描述及理解错误、数据度量的各种性质(如:数据源规格不统一)得不到保证和变化频度不恰当等。

技术因素:主要是指由于具体数据处理的各技术环节的异常造成的数据质量问题。数据质量问题的产生环节主要包括数据创建、数据获取、数据传输、数据装载、数据使用、数据维护等方面的内容。

流程因素:是指由于系统作业流程和人工操作流程设置不当造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程和稽核流程等各环节。

管理因素:是指由于人员素质及管理机制方面的原因造成的数据质量问题。如人员培训、人员管理、培训或者奖惩措施不当导致的管理缺失或者管理缺陷。

1.4 评估指标的内容

1.4.1 联通情况

联通情况:考查医院的前置机在被抽取数据的时间内应保持与平台数据中心的网络畅通。

计算方法:指定周期内在被抽取时间与平台数据中心的网络畅通的次天数。

计算周期可以为星期、月、季度、年。

1.4.2 及时性

考查接入医院在指定周期内是否定时上传数据到前置机,是否有隔天补传情况,是否有多天不传情况。

计算方法:指医院的采集程序在指定周期内定时将业务数据上传至前置机的天数。

计算周期可以为星期、月、季度、年。

1.4.3 稳定性

图1:接入模型图

考查接入医院上传接口表的数据量。

计算方法:指定周期内上传至前置机数据库中33张接口表的数据的条目数。

计算周期可以为星期、月、季度、年。

1.4.4 完整性

考查上传的数据中,每张接口表的字段中的必填字段哪些数据丢失或者哪些数据不可用。采集程序是否将涉及到33张接口表的必填字段全都写入可用数据。

计算方法:指上传至前置机数据的33张表中,每张表有可用数据必填字段的分值之和与这张表必填字段的总分值的比值。

1.4.5 准确性

考查上传的数据中,每张接口表的字段中哪些数值是正确的。是评价接入医院的采集程序好坏的重要指标。

字段准确性:数据符合区域医疗卫生数据采集接口接入指南文档中关于相应字段的数值要求。

业务准确性:可展示数据,与实际业务发生的数据的比值。

1.4.6 关联性

考查上传的数据中,多表之间关联的数据缺失或者未建立。是评价接入医院对接平台工作的重要指标。

实际抽取数据:抽取工具根据规则在前置机抽取到的数据量。

可展示数据:抽取的数据根据逻辑关系在平台展示的业务指标数据。

1.5 评估指标应用举例

1.5.1 门诊总人次小于实际数值

根据门急诊总人次指标计算公式,涉及的表为就诊记录表,表中的就诊类型字段用于区分门诊、急诊、住院、体检。医院上传的就诊记录表中,若就诊类型字段为门诊、急诊类型的总和小于实际业务数值,说明业务准确性存在问题,

3 小结

数据质量的评估指标仅仅是数据质量管理的一部分工作,数据质量管理还包含了对数据的和组织的持续改善和管理。主要包括确定影响数据质量的真实原因,并区分这些原因的影响的数据质量的级别;最终确定为数据质量改善制定方案的行动和建议,包括数据级和组织级的;建立数据错误预防方案,并改正当前数据问题;通过改进组织管理流程,最大限度控制由管理上的缺陷造成的数据质量问题;对数据和管理实施监控,维护已改善的效果;沟通贯穿数据管理始终,循环的评估组织管理流程,以确保数据质量改善的成果得到有效保持,为今后平台的各种业务应用及等级评测提供有力支撑。

猜你喜欢

字段流程评估
图书馆中文图书编目外包数据质量控制分析
吃水果有套“清洗流程”
本刊审稿流程
析OGSA-DAI工作流程
评估依据
CNMARC304字段和314字段责任附注方式解析
无正题名文献著录方法评述
关于CNMARC的3--字段改革的必要性与可行性研究
最终评估
EMA完成对尼美舒利的评估