基于国家电子病历系统应用水平评级标准的儿童医院主数据管理平台建设实践
2019-09-09陈冯薏俞刚
陈冯薏,俞刚
浙江大学医学院附属儿童医院 信息中心,浙江 杭州 310052
引言
浙江大学医学院附属儿童医院(以下简称“我院”)的信息化建设可以追溯到20 世纪90 年代,架构发展受限于建设周期长,各个信息系统分别通过视图或Web Service 的方式进行两两交互,造成接口混乱,基础字典数据不统一。此外我院患者基本信息由于历史原因数据管理较为混乱,存在同一病人多门诊号,多住院号的情况,并且相关数据并缺少关联。
近年来,国家健康卫生委员会(简称“卫健委”)出台了各类文件标准推进“互联网+医疗健康”的发展,不断强调了加强医院建设信息化的重要意义。国家卫健委于2018 年发布了新版的《电子病历系统功能应用水平分级评价方法及标准(试行)》[1-2]评价标准,并要求2020 年所有三级医院要达到4 级以上的评价。标准从3 级开始就对数据标准化有了明确的规范,要求有统一的数据字典,全院信息系统能够数据共享,并为临床科研工作提供数据挖掘功能。从5 级标准开始则要求医院有统一的数据管理。因此我院从2015 年开始,投入大量的资源根据此标准开展医院信息化建设,现我们就过程中的主数据管理平台建设实践做一下回顾。
1 儿童医院主数据管理平台建设方法
我院根据电子病历系统的评级标准,结合医院的信息化实际情况,主要建设以电子病历为核心,基于集成平台和临床数据中心的信息化架构。改造升级了电子病历系统,新建了临床决策辅助系统,新建了基于医疗信息平台、主数据管理平台、医疗大数据服务平台、医院门户集成平台的医院信息集成平台[3-4]。整体建设平台建设的第一步核心内容就是——主数据管理平台[5]的建设(梳理各系统相关的字典数据,创建主索引系统)。
1.1 主数据管理
主数据管理平台搭建在独立为Windows Server 上,通过企业服务总线(Enterprise Service Bus,ESB)的专门信息集成引擎所用消息队列接口MQ 接口和Web Service 接口与各个业务系统关联交互。数据管理平台将所有的主索引、主数据信息都存储在平台数据库服务器上。业务系统数据更新时同步至平台,再由平台下发至其他相关业务系统中。如果平台宕机,不会影响到业务系统的数据使用,仅会影响主数据的同步。管理人员通过Web 网页对平台进行可视化管理。
主数据管理[6](Master Data Management,MDM)通过对核心数据的定义,并在主数据库中实现统一存储,实现所有相关系统的数据同步。主数据管理功能主要包括主数据存储、主数据质量管理、主数据共享和主数据生命周期管理等。医院的主数据包含检验检查项目、收费项目、医嘱项目、药品信息、手术编码、诊断编码等医院基础字典数据,以及各种行业标准和国家标准[7]。主数据管理实现了基础数据的全院统一管理,实现了基础数据的同步或匹配,规范了数据的统计口径,提高了数据质量。
如图1 所示,主数据管理基于面向服务框架 (Service-Oriented Architecture,SOA),将不同系统中的特定数据单元通过定义的接口联系起来,使其可以以独立于实现服务的硬件平台、操作系统和编程语言进行统一和通用的方式交互[8]。其中数据管理系统包含以下几个功能模块:值域管理,(Object Identifi er,OID 对象标识符)管理,数据元管理,字典信息列表,版本管理。
图1 主数据管理系统框架图
1.2 主索引管理EMPI
EMPI[9](Enterprise Master Patient Index,主索引系统)是主数据管理平台的一个功能,利用概率统计学理念,制定一套完整的标准化算法及数据匹配算法,对主索引信息进行更加准确的验证和判断,对患者身份信息、职工信息、科室信息完成有效识别,实现唯一性标识。主索引主要由患者主索引、职工主索引和科室主索引构成。主索引系统支持卫生信息交换标准(Health Level 7,HL7)和医疗信息系统集成(Integrating the Healthcare Enterprise,IHE)规范,通过主索引号关联业务系统的历史数据,最终达到所有信息的互联互通[10],解决业务系统累积的信息孤岛问题。
由图2 知,EMPI 与各业务系统通过ESB 中接口进行集成,完成患者信息的查询、交叉索引,患者信息新建与更新等[11]。主索引库存储着各个系统中同一患者,同一职工或同一科室在其他业务系统中的关联管理。主索引应用通过临床数据仓库(Clinical Data Repository,CDR)对主索引号进行增删改查与统计分析。主索引管理系统对主索引进行管理操作,支持设定合并规则参数阈值,批量导入数据、疑似患者管理。支持手工匹配、合并、拆分相关数据。
图2 主索引系统角色架构
1.2.1 患者主索引建设
由于儿童医院的特殊性,存在很多出生后仍未取名未取得身份证信息的患者。前一次就诊可能仍未有姓名,后一次就诊已有身份信息。一个有效的患者主索引匹配算法,对患者在我院整个儿童时期就诊记录的完整性,连续性尤为重要。我院的患者主索引系统匹配算法根据公式(1)计算匹配分数。对于历史的患者数据,主要根据证件号码、患者姓名、现住地址(由于历史数据此字段基本不会更新,因此匹配可靠度高)、联系人姓名、联系人电话、联系人证件号码[12]进行多字段疑似数据自动匹配[13]。由于历史患者数据完整度低,所以匹配历史数据时相似分数设置较低。相似分数大于60 的则自动判断为相同患者,对于高于45的数据则判断为相似患者进行二次人工判断解除疑似或者数据合并。部分历史数据例如无姓名新生儿患者,联系人信息不全或联系人非父母则难以匹配。因此对于系统更新后的患者要求在就诊时填入必要的基本信息,无身份证等证件信息的患者则要求填写母亲的姓名与身份证号,以保证之后大部分的“二无”患者(无姓名、无身份证)可以被主索引系统识别匹配。但若是“二无”的双胞胎新生儿患者,则主索引系统将难以分辨。此外部分急诊的“三无”患者(无姓名、无联系人、无支付能力)将无法进入主索引。
相似分数=[证件号码]×20+[患者姓名]×15+[出生日期]×10+[性别名称]×5+[现住地址]×15+[联系人姓名]×10+[联系人电话]×10+[联系人证件号码]×10+[联系电话]×5 (1)
式(1)中,“[]”内为匹配字段,根据匹配方法“全匹配”或“最小编辑距离”计算字段匹配值,数字则为相应字段对应的权重。
1.2.2 职工主索引建设
由于各系统工号存在管理混乱,存在不同系统间员工编码无法直接统一,且与人事系统无关联,所有人事基本信息更新严重延迟。建立一套有效的职工主索引制度,能够规范化工号管理,所有人员信息能够及时更新。对于职工主索引的建设,我院设计了一套全新的工号申请流程,如图3。对于正式员工,人事系统中的数据将自动导入主索引系统。主索引系统根据设定好的规则,根据不同类型的人员自动给予不同号段的工号,并将所有工号与基本信息同步入各个相关的业务系统。相关职能科室审批通过工号申请后,于相关系统中查找对应工号并进行权限设置。对于非正式员工的工号(如实习生、规培生等),则由员工向相关科室发起申请后,职能科室手动维护信息入主索引系统,工号仍由主索引自动生成并同步至相关系统。
图3 职工工号申请生成流程图
2 儿童医院主数据管理平台建设结果
我院在上线平台前,对所有字典历史数据与相关科室进行了梳理核对确认,保证首次导入的所有字典数据的唯一性、完整性、正确性,并确认了相关主数据的唯一维护入口和自动同步方式[14]。所有的主数据在主数据管理平台现定义元数据,再定义主数据,经过数据质量管控后同步至所有相关系统中。此外对于每一次的数据更新,进行版本管理,以防版本回退。主数据管理平台上线后,整理导入了所有的字典数据,数量如表1 所示。主数据除了业务系统的定时更新维护外,当国家发布各类新版本字典时需要手动去平台内进行版本更新。对于职工主索引,整理保留了历史医生工号,并整理重建了护士及其他人员的工号,保证了所有人员都有自己唯一的系统工号并能操作相应的系统。整理关联了患者历史就诊信息,但仍存在部分低质量历史数据无法关联。建立的患者主索引中直接合并了466010 条相同数据,判断了868321 条疑似相同数据。患者主索引为患者全息视图提供了数据基础。
主数据管理平台上线使用良好,但仍存在几个问题。第一是如何保证维护的主数据的唯一性,重复主数据会影响数据质量,不利于数据挖掘。可以在平台上建立重复数据检测算法,自动检测新增数据的可信度,是否存在相似或重复数据,定期进行主数据质量维护。第二是数据安全。主数据管理平台有独立的数据库存储数据,建立一套安全高效的数据传输体系和数据库访问权限设置将有效保护数据安全。第三是新生儿患者主索引的匹配算法持续改进。基本信息录入的完整度影响患者主索引的应用效果,如何设置更合理的基本信息采集方式,将影响新生儿患者进入主索引的概率。
表1 主数据管理平台导入字典数量(条)
3 总结
所有系统数据的整合都是基于主数据的建设管理。我院根据国家电子病历系统评级的要求搭建了基于各项标准规范的主数据管理平台,结合儿童医院的特色进行了患者主索引、职工主索引以及主数据的维护流程设计,为之后的集成平台建设、数据中心的创建打下了坚实基础。