APP下载

基于数据挖掘技术的电子病历的研究与设计

2019-09-10唐海英王体春吴婧尹定洪段昌柱

现代信息科技 2019年8期
关键词:数据挖掘

唐海英 王体春 吴婧 尹定洪 段昌柱

摘  要:电子病历系统运用多种技术手段,实现模拟医学专家思维方式,对病情数据进行高效准确的推理分析。系统对检查报告、病情、病人的综合情况、药物信息进行综合分析和最佳匹配,实现帮助病人高效就医,提高医生的诊断准确度和效率的目的,满足现代化的医学信息化的需要。

关键词:电子病历系统;推理分析;数据挖掘

中图分类号:R197.324      文献标识码:A 文章编号:2096-4706(2019)08-0106-03

Abstract:The electronic medical record system uses many kinds of technical means to simulate the thinking mode of medical experts,and to reasoning and analyzing the disease data efficiently and accurately. The system carries out comprehensive analysis and optimal matching of examination report,patient’s condition,patient’s comprehensive situation and drug information so as to help patients seek medical treatment efficiently,improve the accuracy and efficiency of doctor’s diagnosis,and meet the needs of modern medical informatization.

Keywords:electronic medical record system;rational analysis;data mining

0  引  言

電子病历(Electronic Medical Record,EMR)也叫计算机化的病案系统或称基于计算机的病人记录(Computer-Based Patient Record,CPR)[1]。它是用电子设备(计算机、健康卡等)保存、管理、传输和重现的数字化的病人的医疗记录,取代手写纸张病历。它的内容包括纸张病历的所有信息。美国国立医学研究所将其定义为:EMR是基于一个特定系统的电子化病人记录,该系统提供用户访问完整准确的数据、警示、提示和临床决策支持系统的能力。

1  电子病历系统的需求分析

电子病历系统利用远程数据库访问技术,接收用户发送的查询信息的请求数据,然后对数据进行分析和处理,及时、准确地反馈给用户疾病信息和数据。如果用户发送的是描述病情的数据,电子病历系统就对数据进行分析处理然后做出显示,让用户直观地查看病情分析报表[2]。如果用户发生检查报告,系统会通过数据挖掘技术,利用计算机模拟医疗专家思维推理,推测病情,为用户治病就医提供及时、准确的依据。同时电子病历系统利用计算机网络的交互功能,实现用户与用户、用户与系统管理员的信息、经验交流和互动的功能[3]。

本文电子病历系统采用数据挖掘技术为主进行推理设计。数据挖掘(Data Mining,DM)又译为资料探勘、数据采矿,是数据库知识发现(Knowledge-Discovery in Databases,KDD)中的一个步骤。数据挖掘是从数据中挖掘知识,一般指从大量的数据中通过算法推理发现隐藏于海量数据中的信息知识的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理(OLAP)、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现。一般包括数据清理(消除噪声和不一致数据)、数据集成(多种数据源可以组合在一起)、数据选择(从数据库中提取与分析任务相关的数据)、数据变换(数据变换或统一成适合挖掘的形式,如汇总或聚集)、数据挖掘(使用智能方法提取数据模式)、模式评估(根据某种兴趣度度量,识别表示知识的真正感兴趣的模式或知识)、知识表示(使用可视化和知识表示技术,向各类用户提供挖掘的最终的知识)等过程。因此数据挖掘就是从数据库、数据仓库或其他信息库中的海量数据中发现感兴趣知识的过程。

电子病历系统以医学知识和经验为基础,通过对病人信息、检查报告、心电信息、B超图像等信息进行采集、分析和推理,达到帮助用户快速高效地了解病情、记录病情、联系专业医生就医的目的。电子病历系统的系统构建以病历数据库、检验报告图形库和知识库为基础,以推理机为核心,重点在于对知识结构和基础进行编码,对推理挖掘模型和算法进行开发,以统计学方法对结果进行验证分析,以精炼和优化数据库及推理机制为系统的扩展性要求。系统的主要研发内容包括:

(1)准确的医学知识的查询;

(2)病历信息的准确查找;

(3)医学知识的管理和推理挖掘模型的建立;

(4)系统推理挖掘机制的实现;

(5)系统的维护和调试及可扩展性设计。

2  电子病历系统的功能设计

电子病历系统由医学信息查询、病历查找、检查报告处理、医保政策、专家建议、系统论坛、系统维护7个功能模块组成。(如图1所示)

(1)信息查询:本系统基于人工智能技术,以丰富的医学知识和经验为推理基础,模拟医学专家的思维方式,依据查询的问题,结合知识库进行专家推理,从而及时准确地给出信息回复;

(2)病历信息查询:建立最佳匹配模型,根据病人的病历编号、就医时间、病种等关键信息匹配查找;

(3)图形化处理:以用户提供的检查报告的图片,基于计算机的数据处理技术,生成数据统计报表,帮助用户分析病情;

(4)医保政策:基于计算机网络远程数据库访问技术对医疗保险相关政策进行普及;

(5)专家建议:基于数据挖掘技术,以大量的医学知识和经验为基础,对各种病情数据进行数据分析并构建数据模型,帮助用户了解病情、了解康复知识、了解就医知识,确保医生快速、准确地做出判断;

(6)系统论坛:基于计算机网络的交换技术,为用户之间以及用户与系统知识管理员之间构建信息交流平台;

(7)系统维护:可以控制用户权限,可以实时对系统数据库进行维护和更新,以及扩充系统功能。

3  系统的实现

3.1  系统数据库/数据仓库的构建

构建电子病历系统的医学知识数据库、检查报告图像数据库、推理算法模型数据库,然后针对各数据采用多层模型的星形架构建立数据仓库,数据库库中几个主要数据库介绍如下。

医学知识数据库:收集国内外医学专家对病症研究的经验、案例、文献,抽取不同类型的案例及关键词和结论意见,设定转换代码,构建医学知识库。

图像数据库:保存检查报告图像。

推理算法模型数据库:根据获取的信息综合运用不同的计算机算法和搜索策略,模拟医学专家的思维过程,输出结果或提出进一步调查的意见和方向。

3.2  系统数据库/数据仓库的精炼

在初步建立电子病历系统的基础上,应用不同的推理机模型对100例病人的病历,通过统计学分析,比较验证不同模型诊断正确率;对挖掘推理过程进行监控,标定数据库的冗余特征值和无效值,以精炼数据库/数据仓库。

3.3  人机界面及智能化的帮助模块的构建

人机界面主要涉及为用户提供数据录入的接口和对数据处理结果进行输出,显示医学专家的意见或需要进一步完善的检查。采用图形界面包括:

(1)基本信息的录入区;

(2)环境参数录入区;

(3)检查报告图片录入区;

(4)病人病情录入区;

(5)就医建议录入区;

(6)病症种类选择区;

(7)帮助信息区;

(8)提供“向导”模式和“高级”模式。

模块的智能化通过系统的自学习来完成。系统的自学以神经网络学习为基础。将输出层出现的与事实不符的误差,归结为连接层中各神经元的连接权及阈值的过错,通过把输出层神经元的误差逐层向输入层逆向传播,以分给各连接神经元,从而可算出各连接点的参考误差,并根据此对各连接权进行相应的调整,使网络达到适合要求的输出,实现训练模式对A(k)→C(j)的映射,(k=1,…,m;j=1,…,n)。对于经过多次自学习仍不能纠正的误差,则采取专家人工调试的方法,对推理的机制重新进行梳理和调整。

3.4 ; 精准的医学专家思维推理的实现

系统通过人机界面接受、反馈相应数据信息,系统构建以图像数据库和医学知识数据库为基础,以推理模型算法数据库为核心,重点在于对知识结构和基础进行编码,对推理模型和算法进行开发,以统计学方法对结果进行验证分析,以智能化的幫助模块对相关数据进行优化,以达到精确反馈信息的目的。如图2所示。

4  电子病历系统的优化

我们采用PDCA闭环设计策略,对系统进行循环优化:

(1)制定优化计划,包括测试检查计划、试运行计划、运行维护计划等等;

(2)执行预定计划并不断补充完善原有计划,聘请医学工作者在实践中使用电子病历系统,对用户界面及应用效果进行反馈,以进一步改进推理模块,提高推理效率,优化系统。同时招募志愿用户免费开放,采用用户操作后问卷调查、电话访谈等形式及时与他们沟通交流,根据用户的反馈意见,实时更新系统数据库信息,改进用户界面和系统功能;

(3)执行检查检测,对出现的问题加入问题清单;

(4)处理出现的问题,针对较大问题重新制定计划进入下一轮PDCA环,以保证系统质量不断提升。

经过本课题试用和使用,收到了良好效果,下一步将结合医改的不断深化和政策的调整,对知识库进行不断更新的同时,对挖掘推理规则进行改进化。

参考文献:

[1] DENG Lifang,GAN Ping,ZHOU Jin , et al. Image hiding and mining based on the subsection Zadeh-x transform[C]// International Conference on Computer Engineering & Technology. IEEE,2010.

[2] 王体春,韩永国.基于本体的课程学习系统设计 [J].兵工自动化,2007(2):58-59+64.

[3] 唐海英,王体春.基于本体的个性化协同推荐 [J].计算机与网络,2011,37(16):56-58.

作者简介:唐海英(1981-),女,汉族,重庆人,硕士,研究方向:超声医学效应的基础研究;通讯作者:王体春(1976.02-),男,汉族,四川绵阳人,高级工程师,博士,研究方向:生物医学信息技术、医学信息、图像处理。

猜你喜欢

数据挖掘
近十年国内教育数据挖掘领域的应用技术分析
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘技术在物流企业中的应用
数据挖掘过程模型及创新应用
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
电子政务中基于云计算模式的数据挖掘研究
数据挖掘创新应用
数据挖掘的系统构成与发展趋势