不依赖LIS 系统接口的医院报告在线浏览系统
2020-12-28巴武龙楚治良孟晓东
巴武龙,楚治良,王 珊,孟晓东,吉 萍,赵 光
医学实验室信息管理系统(laboratory information management system,LIS)是利用计算机网络技术和数据存储、处理技术,快速高效地对医学实验室信息的采集、存贮、处理、传输、查询和分析等全方位管理的计算机软件系统[1]。近年来,随着计算机网络技术的飞速发展,越来越多的实验室已经建立了自己的LIS 系统[2],并与医院的医院信息管理系统(hospital information system,HIS)、临床信息系统(clinical information system,CIS)进行基于局域网的数据互通,使得检验科与临床科室的信息传递更为流畅,并保证了数据的可追溯性,在医院信息化的建设中发挥了非常重要的作用。
目前, 医院的检验设备自动化程度越来越高,检验设备、LIS 系统和HIS 系统之间的信息交互是一个重要环节。 作为目前全球应用最广泛的医疗信息交换标准——HL7 标准已经得到了医疗领域专家学者的认可[3]。 在 HL7 标准下,检验设备和 LIS系统通过LIS 接口实现信息的交互,LIS 系统和HIS系统再通过信息交互,从而实现院内信息资源的共享。 但是在实际工作中发现,有些医院并不是所有的检验项目都实现了院内检验报告的在线共享,仍是以纸质版报告发送给患者或医师。 调查发现,引起这类问题的原因主要有两类。 一是,有些临床实验室, 只有由仪器公司提供的单一的数据处理软件[4],而没有LIS 接口。这类项目主要是一些高精新的检验项目,往往需手动编辑word 类报告,例如采用流式细胞仪进行白血病免疫分型检验等项目。 二是,在医院信息化建设的过程中,系统之间的设计不可能一步到位,每一次的设备更换或升级都意味着需要设备厂家和软件公司、 医院LIS 接口工程师共同协商解决,这就需要三方投入较大的人力物力财力成本[5]。 有些医院出于各种原因的考虑而没有将这些检验项目接入到LIS 系统,也就无法实现院内数据共享。
针对上述问题,该研究尝试利用电子文档提取技术,对检验实验室生成的电子报告进行关键信息提取,并以MTV(Model template view)模式构架网站以实现检验报告院内局域网在线浏览,以期开发出一种技术简单、开发迅速、人力财力成本低的院内报告在线浏览系统。
1 系统设计及开发环境
1.1 服务器端 由于本系统针对的主要是一些没有接入LIS 系统的报告,此类报告一般占医院所有报告的比例较小, 并且经过对系统的优化处理,系统所需计算机资源较小,故所需硬件要求不高,CPU i3 及以上处理器、4G 及以上内存即可保证系统运行流畅。 用于存储的硬盘越大越好,方便以后的报告存档。 操作系统为Windows 7 及以上版本操作系统。 采用轻量级 Apache 2.4 作为应用服务器,Mysql 5.7 作为后台数据库。选择Pycharm 作为开发工具, 以Bootstrap 作为前端界面主要开发技术,以Django 作为整体框架。 Django 是一种遵循 MVC(Model view controller) 模式的框架, 然而,Django采用的MVC 模式与传统意义上的MVC 模式有所不同[6]。 Django 整个框架分为模型(Model)、 模板(Template)和视图(View)三部分。 该研究中模型Model 为数据存取层, 根据不同检验项目设置不同的数据库用于存取数据; 模板Template 为表现层,处理与表现相关的决定,根据不同检验项目设置检验项目显示模板;视图View 为业务逻辑层,用于设计存储数据及调取适当模板两种操作之间的逻辑关系。 从而实现以数据库驱动前端来进行检验报告的在线浏览。 Bootstrap 是基于 HTML、CSS、JavaScript的前端框架,它简洁灵活,使得Web 开发更加快捷。系统设计如图1 所示。
图1 系统设计
1.2 客户端 该系统基于B/S 模式,无须安装特定软件, 仅需客户端能够流畅运行谷歌等浏览器即可。
2 基本业务流程设计
该研究目的在于验证将未能接入LIS 系统的检验报告通过电子文档提取技术实现院内局域网在线浏览这一方案是否可行,故基本业务流程主要设计为四部分:(1)检验电子报告生成;(2)电子报告上传;(3)检验报告审核及检验报告发布。 实际检验工作中仍需遵循医学检验标准。 该研究所述基本业务流程设计图见图2。
图2 基本业务流程设计图
3 电子文档提取技术的实际应用
在利用电子文档提取技术对医学检验电子报告进行提取的关键步骤中,如何简便正确地提取决定了系统的开发和维护成本。 医学检验项目都有明确的目的性,即要确定某项指标的具体数值或性状等,从而为疾病的诊断提供依据。 在此基础上,检验技师出具相关的检验电子报告通常具有比较严谨的逻辑性,这为电子文档提取技术的应用提供了可能。 例如针对Word 电子报告,可利用Python 第三方库docx,非常简便有效地提取出所需数据。 以运用流式细胞仪进行白血病免疫分型检测为例,检验人员所出具的电子报告有如下描述:(1)初筛管。 B系标志:CD19=54.7%和CD10=0.09%;T 细胞标志:CD7=2.13% ; 髓 系 标 志 :CD33=96.28% (+ ) 和CD117=93.24%(++); 早 期 标 志 :CD34=94.98%(++)。 (2) 髓系检测。 CD9=2.63%(+);HLA-DR=97.82%(+++);CD123=94.87%(+); CD13=95.13%(+);CD16=0.44%;CD38=97.91%(+);CD14=1.29%;CD56=7.6%;CD64=3.26%;CD11b=5.09%; CD2 =0.44%。 (3) 胞内标记。 cCD3=0.3%(T 淋巴细胞);cMPO=98.3%(+)(髓系标志);cCD79a=4.1%(B 淋巴细胞)。(4)参考意见。总体印象(CD45/SSC):幼稚细胞占总细胞数58%, 单核细胞占总细胞数55.1%,其他各系比例降低。 幼稚细胞门细胞大量表达CD13、CD33、HLA-DR、CD123、CD38、cMPO、CD117、CD34;结合骨髓象,考虑AML-M5。
针对上述报告, 可用如下几行代码完成提取,见图3。
图3 示例代码
上述代码分类提取出初筛管、髓系检测、胞内标记和参考意见四个段落中的内容,下一步可将上述内容存入数据库以方便医师调阅报告。 相同方法可根据实际需要分别对前三个段落中对应CD 分子所占比例进行提取, 并将提取内容存入数据库,方便以后调用或对比。 对于含有图片和表格的Word报告,也可用类似方式进行提取。
在笔者医院的实际运行过程中,该系统较好地实现了预期目的, 使个别没有纳入Lis 系统的报告实现了在线浏览,解决了信息孤岛问题,提高了该院的数据共享程度。
4 结果与讨论
通过该研究的方法和思路,可以实现医院未接入LIS 系统的检验报告在线浏览,同时由于该系统所提取出的报告数据, 实时存入数据库中, 为HIS系统与该系统之间的数据交互提供了可能,进而解决了“信息孤岛”问题,有效提升了医院信息的全面共享程度。 该研究所表述的利用Python 第三方包docx 对Word 版电子报告进行检验内容提取, 所需代码数量少,开发简单。 以Django 框架架构的网站相比其他系统架构也具有更加简便快捷的开发形式。 上述便利条件使得该院信息科技术人员可以快速开发并灵活升级系统。
当然,该系统也有不足之处。 Django 框架的并发性有待进一步优化, 如何优化系统的并发性,将是下一步的研究目标。 另外,不同医院的同一检验项目的电子报告模板可能不同,需要针对不同的模板设置不同的提取模块。 统一报告模板后,将大大增加系统的通用性。
综上所述, 该系统的开发具有方便快捷的特点, 可快速实现未纳入Lis 系统的检验报告的院内局域网在线浏览,方便临床同时降低成本,可作为LIS 系统的一种补充。 该研究所述系统《不依赖LIS接口的医院报告在线浏览系统》(软著登字第5132460 号)已经获得软件著作版权,同时部分相关源代码已经以apache 2.0 协议进行了开源,用以方便其他医院以此为模板便捷地开发自己医院的系统,以期发挥更好的社会效益和经济效益。