脐带血库信息联网查询系统设计与应用
2019-12-19汪德海高建恩李天君
汪德海 高建恩 李天君 于 磊 马 旭
国家卫生健康委科学技术研究所,国家人类遗传资源中心(北京,100081)
目前,我国卫生行政部门批准设立在北京、上海、天津、山东省、广东省、四川省、浙江省共有7家脐带血库。公开的信息数据显示,我国公共脐带血存储已超过10万份,数据分别存储在上述7家脐带血库中。医疗用血机构需要分别给7家脐带血库提交配型查询申请,配型查询流程繁琐,反馈周期长、效率较低。利用现代信息技术建立集中的脐带血库信息联网查询平台(简称脐带血联网系统),对提高查询效率及资料的完整性和准确性、统筹管理我国脐带血资源均具有非常重要的意义[1]。
1 脐带血联网系统研究
1.1 研究内容
针对全国的脐带血公共库信息资源共享和业务协作的需求,主要包括以下研究内容:①系统的技术框架;②业务流程与数据库;③信息交换与共享;④数据安全防护;⑤子系统功能;⑥数据管理与分析。
1.2 研究方法
脐带血联网系统研制和开发的技术路线,首先确定信息系统需求分析,包括平台的总体设计需求、不同用户的需求以及系统的功能需求;其次开展系统设计工作,主要包括系统的总体设计方案、系统的功能模块划分以及相应的数据库设计;最后制定系统的开发方案进行应用评估。
需求分析主要通过调研的方式进行,包括:①查阅文件资料,包括项目手册、实施方案、工作流程、技术规范、管理职责、上报报表等。②访谈,编制需求调研表和访谈提纲,采取小组座谈,头脑风暴、个案访谈等了解系统的用户群体,获取每类用户的功能需求。③现场调查,查看业务流程,了解采集和资料收集的流程与方式。
2 脐带血联网系统设计
2.1 技术架构
将软件系统看成是一个生态,把软件系统的发展看成是生态的进化,不断适应新的需求变化。这样就需要一个不同于传统软件的分层架构,在开发脐带血联网系统中选择了多边形软件架构,见图1。
图1 脐带血库信息联网查询平台系统软件构架图
采用多边形架构是要使系统能够以对人、程序、自动化测试用例等一致的方式运行,一个松耦合结构。事件从限界上下文外的一点传入,经过相应适配器的转化,然后再转发给应用程序,最后到达领域模型。领域模型处理完事件后,将结果发送到指定的适配器,经适配器转化后,发送结果给事件的发起方。通过多边形架构很好的解决了各个脐带血库数据标准不一致的问题,同时为以后新的数据形式加入预留了空间,同时也为开发接口提供了便利。联网系统软件层次关系见图2。
2.2 业务流程与数据库
脐带血联网系统功能包括数据采集服务、配型查询服务、医疗机构管理、医疗机构用血管理和脐带血库发血管理等。见图3。脐带血联网系统依据数据建模理论对系统所涉及的数据进行分析,梳理了各类数据的组织方式,确定了数据库的管辖范围,最后确定了使用关系数据库存储数据以及各个数据库表的结构。在关系数据库中数据被组织成具有某种元数据的表格,表格数据以不同方式存取。脐带血库信息联网系统包含了100多个元数据库表格。
图2 脐带血联网系统软件业务层次关系图
图3 脐带血联网系统业务功能流程图
2.3 信息交换和共享
采用RESTful的方式实现数据交换接口,非常的轻量、跨平台、跨语言,比传统的web服务具有较高性能。系统实现了6个标准化接口:①用户认证接口;②数据上传接口;③数据删除接口;④数据状态变更接口;⑤脐带血数据变更接口;⑥HLA数据变更接口。
2.4 数据安全防护
脐带血联网系统采用HTTPS方案进行数据的传输,以保证数据传输的安全性。HTTPS是在HTTP的基础上添加了SSL安全协议,自动对数据进行压缩加密,有效防止监听、劫持、重发。脐带血联网系统第一级安全措施采用自行研制的认证授权机制,确保接口调用的安全性[2]。系统为每个接口都添加了签名,同时也给每一个客户端都分配一个令牌,客户端的每次请求都将令牌和参数发送给服务器验证,如果验证成功服务器会返回正确的结果数据。如果验证失败,服务器会拒绝服务,同时记录下完整的上下文信息,以备审计时使用。第二级安全措施进行安全三等级保护认证。参照《信息安全等级保护管理办法》(公通字[2007]43号)要求,建立了信息安全管理领导小组,配置三等级保硬件设备设施,建立了信息安全管理体系文件和评价改进机制,与软件合作商签订了保密协议。从管理方面有效保护脐带血供者和临床患者信息安全,也保障了脐带血平台数据信息的安全。
2.5 子系统功能
脐带血联网系统的主要功能是收集各个脐带血库中的公共脐带血资源数据,存放和管理,对具有资质医疗机构提够HLA配型查询服务。系统主要功能:①数据采集服务,主要采集脐带血的条码号、采集时间、入库时间、婴儿性别、民族、冻前有核细胞数、冻存体积、ABO、Rh(D)、CD34+细胞总数、祖细胞数、HLA分型检测方法、类别、分型数据信息、脐带血库所属信息、脐带血使用状态等信息;②配型查询服务,采用特定的配型算法筛选所有数据,匹配过程忽略所属库属性,以保证筛选的公平、公正和准确。算法只考虑位点相合数,每个患者的HLA分型信息和库中每份脐带血的分型信息进行交集运算。所有位点的匹配值加和即为相匹配位点数,位点匹配时去掉等位基因相关信息,匹配位点最多排最前,如果匹配位点数相等时则按照分离后细胞总数由高到低排列。算法时间复杂度由总数据量决定,在30万份以内的脐带血分型信息中能够保证在2秒内完成匹配运算。③医疗机构管理,管理医疗机构信息,信息包括机构编码、名称、电话、邮编、传真、邮箱、地址、主要负责人、诊疗科目、床位、注册资金等。同时帮助审核该医疗机构是否具备造血干细胞临床应用资质,保障患者用血安全。④医疗机构用血管理,主要包括复检申请、复检报告、确认申请、脐带血接收、临床应用、跟踪回访、病种模块,医疗机构严格按照相关标准管理脐带血。⑤脐带血库的发血管理,收到医疗机构的最终使用确认书后,按照确认书上的条码准备脐带血,并按照输注日期制定运输方案,制定备用运输方案。
2.6 数据管理与分析
脐带血联网系统业务涉众广泛,既包括各个脐带血库又涵盖大量的医疗机构。这些涉众对数据的要求和理解都不相同,对相同数据项中的不同数值的含义理解也不同。建立一套数据标准就是要减少这种差异,让涉众对于数据含义的理解趋同,降低差异化水平。数据标准的建立是一个沟通、协调的过程,需要时间演化。针对采集数据可进行新建、修改、删除、状态变更操作,并且对数据操作的历史记录进行存档,做到数据变更有据可查。所有的数据信息可以生成可视化统计图表及报表,并提供针对EXCEL的数据导入、导出功能,满足脐带血配型查询的全部要求。
3 联网结果和应用
至2018年底,脐带血联网系统已经联网脐带血数据85 464例,并在多家医疗机构进行了试用,共查询检索数据230例。具体联网数据见表1。
4 讨论
脐带血联网系统遵循敏捷的构建方法,以需求变化为出发点,采用迭代和循序渐进的方式进行系统构建。在系统构建的初期,对业务流程进行了全面细致的调研,形成了总体的业务蓝图,然后将系统分割成多个能够独立运行的子系统,再对每一个子系统分别设计、开发和测试。当任何一个子系统完成测试就集成到系统中来。采用敏捷的构建方法缩减了开发周期,每个子系统的需求成熟度不同,成熟的子系统先做,不成熟的后做,互不影响。
表1 全国公共脐带血库信息数据联网结果
注:系统数据调试过程中
脐带血联网系统采用了B/S架构,组件式的设计思想。在保证系统可靠性和安全性的前提下,着重提高可扩展性和可定制化。集中式部署可实现业务服务器和数据存储服务器统一管理,系统运行维护在复杂度和故障恢复能力上有极大的优势。
使用脐带血联网系统为查询工具,优化了查询过程,简化了操作步骤,提高了查询效率,提升了查询质量。该系统工具用于脐带血库的业务管理以及数据维护,也用于移植医院进行脐带血配型查询、脐带血申请,既用于卫生行政管理部门进行脐带血的各种数据查询、统计和分析。
目前,该系统已经整合了全国6家脐带血公共库的全部有效数据,并制订了数据更新策略。该数据库是全国最全面、最完整的脐带血公共库信息,收录了85 464例脐带血数据。在此基础上,搭建了脐带血联网平台,直接供临床医生使用,该系统可以根据临床医生的经验自定义查询策略或者选择系统推荐策略,根据患者的配型申请,筛选最适宜的脐带血供者。整个查询过程不需要各个脐带血库进行任何操作,查询过程可在30秒内完成。临床医生选择了合适的脐带血后可以直接生成申请单,脐带血库工作人员第一时间收到确认单后,按制订的流程进行复检,复检完成后可以手动或自动将复检结果上传至该系统。临床医生接到复检结果后确定该移植方案,并约定运输时间和地点。脐带血库在按照系统约定的运送时间,派人将脐带血送达临床医院,完成整个的脐带血配型和申请流程。
随着脐带血应用技术以及计算机技术的不断发展,跨领域技术融合的需求越来越迫切,即要保证供者、患者、医院以及脐血库的信息安全,又要发挥大数据时代科技创新的成果,必须要建立统一的信息标准,逐步完善国家脐带血库联网系统的功能,为我国的脐带血临床应用提供有效的支撑工具[3-4]。