APP下载

全文检索引擎技术在电子病历中的应用

2015-05-04赵景越徐松青蔡连忠

数字技术与应用 2014年12期
关键词:电子病历全文检索

赵景越++徐松青++蔡连忠

摘要:针对医院临床电子病历数据大量积累无法快速、高效地服务于临床医疗、医学科研、以及病例管理的现象,提出研究更高效的电子病历检索方法,采用全文索引搜索引擎技术,以关键字为索引,把电子病历统一转换成XML形式,最后生成病历检索索引文件方式,建立电子病历全文检索系统。系统通过实际数据测试表明,该检索方法准确率较高、检索速度快。

关键词:电子病历 全文检索 XML

中图分类号:R197.324 文献标识码:A 文章编号:1007-9416(2014)12-0089-02

1 引言

随着信息化技术的飞速发展,计算机技术越来越多地应用到了医疗领域。近年来医疗行业大力加强信息化建设,建立和完善以电子病历为核心的医院信息系统。电子病历作为临床信息的载体以及医院信息系统的核心构成了医疗卫生决策等系统的基础。目前很多医院患者电子病历内容存储比较分散,例如医嘱、手术信息存储在HIS里、检验结果存储在LIS系统,手麻等检查报告存储在相应检查系统中,如果要获取患者全部病历信息只能通过患者ID号来查询,然后通过病历的存储规则来找到相应的病历,再通过显示规则加以排列显示。每次得到的信息都是分散的,而且存储方式各不相同,存在于病历文本中的大量非结构化的信息也不能作为检索条件,因而很多医疗数据不能为医疗工作者充分利用,大大降低临床数据利用效率。因此,为了满足医生临床诊疗需求、科研辅助需要,医院电子病历管理系统的现行检索查询处理方式问题亟待解决。为此,我们提出了,将所有病历文件统一转换,统一识别,再采用以基于关键字的全文检索引擎技术,建立电子病历全文检索系统,实现方便、快捷地为临床医疗、医学科研及病历管理等方面工作提供服务。

2 全文检索引擎简介

全文检索是指计算机索引程序通过扫描文章中的每一个词,并收集文章内容到本地,对文章内容及分词建立索引,经过加工处理建立信息数据库和索引数据库,指明该词在文章中出现文章和次数,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查询结果反馈给用户的检索方式,从而对用户提出的各种检索作出响应,提供用户所需的信息或相关指针。

3 电子病历数据处理

目前由于医院意识到电子病历在医院信息系统建设中的核心重要性,纷纷加强电子病历信息化建设,实现病历记录贯穿于患者在医院就诊的各个环节中,实现以统一视图方式展现患者临床病历信息。但由于国内医疗信息化建设历史原因,很多医院病人电子病历内容存储比较分散,例如医嘱、手术信息存储在HIS里、检验结果存储在LIS系统,手麻等检查报告存储在相应检查系统中;为此有必要进行统一整合,将分散在院内各系统的电子病历信息转换为统一形式的文件存储于电子病历库中。

可扩展标记语言(eXtensible Markup Language,简称XML)就是建立并实现该统一转换模型的一个有效手段。XML是一种置标语言,置标指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。它与HTML一样,都是SGML(标准通用标记语言)。XML是互联网环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。XML同时也是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立。

为此将要先定义、规范病历内容的结构,然后将临床各系统中关于患者的病历数据进行抽取、整合、转换成电子病历架构的符合格式,生成描述患者病历的XML文件,作为患者病历存储检索管理的基本单位。

4 系统设计( 图1)

系统将来自各系统(HIS、电子病历、LIS等)的临床科研数据进行采集,并生成对应的XML格式,再根据XML格式数据建立全文索引,形成全文索引库;完成临床科研数据积累;完成数据收集后,系统提供全文索引查询功能,根据查询结果,系统可以直接显示该病历文件详细信息,还可以关联显示该患者对应的病案,方便科研人员随时调阅分析。

5 系统测试

5.1 服务器端软件环境

服务器采用Sun公司的JDK 1.5.0版本,应用容器采用开源免费JBOSS4.0.4版本。

服务器操作系统采用微软的Windows Server 2008企业版。

服务器数据库采用SQL Server 2008企业版及SQL JDBC驱动。

客户端支持通用浏览器,本案例测试中采用了IE8。

5.2 服务器端硬件环境

服务器采用的CPU为Inter Core2 Quad CPU Q8200 2.33GHz,内存4GB,硬盘1TGB

5.3 测试结果

针对医院测试库中2万名患者,约120万份电子病历文件,转换生成XML文件,建立索引,形成全文索引库,输入条件“男”、“骨折”、“髋部”,如图2:

系统在2秒左右时间搜索到满足条件的文档78761份,并按检索条件关联度进行排序,以患者姓名、性别、年龄、病历类别作为标题,同时简略显示关键词在文件中位置并加以警示;单击标题便可以浏览病历详细信息。通过上述查询测试可以看出,本系统实现了电子病历一体化,检索定位准确率高,达到了系统应用的性能要求。

6 结语

根据以上测试结果可以看出系统性能出众,满足当前设计要求;不仅能基于关键字快速检索,大大提高病历检索速度,同时实现查询结果与电子病历无缝对接,直接通过满足条件的查询结果可以打开病历文件,浏览该患者病案内容(护理文书、医师病历、检查结果、检验结果、医嘱等),大大提高临床科研效率。

参考文献

[1]基于语义的电子病历智能全文检索[J].医疗卫生装备,2008.

猜你喜欢

电子病历全文检索
Oracle数据库全文检索性能研究
基于KySou的全文检索系统的分析与优化
用JSP调用Lucene包来实现全文检索