APP下载

静脉血栓栓塞症风险评估与预警监控系统设计与实现*

2020-11-25宋晓琴

医学信息学杂志 2020年6期
关键词:数据源数据挖掘分级

宋晓琴

(郑州大学第一附属医院郑州 450052)

李晨辉

(东华医为科技有限公司北京 100190)

顾春晓

(郑州市职业病防治院郑州 450053)

余晓红

(郑州大学第一附属医院郑州 450052)

1 引言

静脉血栓栓塞症(Venous Thromboembolism,VTE)是指静脉内形成血凝块,包括深静脉血栓(Deep Venous Thrombosis,DVT)和肺血栓栓塞症(Pulmonary Thromboembolism,PTE)两种临床表现形式[1],是医院内非预期死亡的重要原因之一[2]。近年来VTE发病率呈迅速上升趋势,早期识别VTE高危患者,及时进行预防可降低医疗风险[3-6]。现有VTE防治软件产品散见于移动终端APP和一些医院自行开发的小程序,仅实现专家量表数字化和自动计算功能。个别产品虽能提供防治建议,但由于未结合专家指南,缺乏可操作性。加之国内医护人员普遍对VTE认识不足,防治意识薄弱,医院在VTE防治方面效率较低[7-8],亟需构建精准高效的VTE防治监控体系。针对这一现状,在前期测试原型的基础上对VTE风险评估与预警监控系统进行结构性调整,细化功能需求,综合运用多种评估方法,将量表评估方法与数据深度挖掘技术相结合,通过迭代开发和样本训练,涵盖VTE防治与质控主要内容,逐渐形成一个智能化、自动化VTE防治专业性软件产品。

2 系统分析

2.1 概述

VTE系统根据国家诊疗指南[9-15]和医院诊疗方案[16-17]向院内各专业科室提供VTE风险评估与预警监控服务,向相关医护人员推送VTE防治提示和预警信息,同时动态监测医护执行记录和患者数据集,及时跟踪反馈VTE防治变化情况。为医院在VTE风险评估、预防、诊疗、质控方面提供辅助决策支持,为探索构建常态化VTE防治质量监控体系提供参考。系统主要实现智能文本识别与语义分析、VTE风险评估模型、出血风险评估模型、预防诊疗方案生成、VTE防治质量监控与信息反馈等功能。

2.2 核心问题

2.2.1 多源数据采集与分析 多源异构电子病历存在数据采集时间点设置、数据格式不统一、数据内容不一致、本地转存冗余等问题,处理不当会影响VTE特征数据整理与转化结果。解决方法一是设定对外部数据源进行采集的时间节点序列;二是利用自然语言处理技术实现文本识别和语义分词;三是通过技术手段规避数据内容不一致和本地转存冗余的问题。

2.2.2 构建风险评估模型 通用VTE风险评估根据患者情况,结合各种VTE国际认可评估量表进行综合打分计算分级,通用性强但存在量表繁杂、标准不统一、受主观因素影响较大等问题。为保证VTE系统准确性和通用性,在实现数字化VTE量表加权计算评估分级模型基础上,利用数据挖掘与统计分析技术对多维危险因素进行特征整理,对多量表进行加权计算,一方面实现对患者VTE风险评估分级的相互验证;另一方面为实现基于机器学习的智能数据挖掘分析模型提供研究基础。

2.2.3 预防诊疗方案分级关联 不同患者分级和预防诊疗方案不同,不当措施会威胁具有出血风险的患者生命。本系统依据VTE风险分级模式,对患者采取群体分类方法,为各类专科防治指南提供参考。而诊疗个体分类方法需要数据挖掘、统计分析和机器学习等相关技术支持,开发周期较长、成本较高,拟在后期升级版本中实现。

2.2.4 防治信息统计与可视化 为及时全面展示医院VTE防治情况,系统需要实时获取各临床科室VTE防治数据,根据统计分析结果绘制出不同分辨率(颗粒度)的VTE防治态势图。院方质控部门依据态势图,结合聚焦点和业务要求,动态生成各类VTE防治报表,为管理人员提供可视化VTE防治态势感知和辅助决策支持,同时为质控部门提供全过程VTE预防诊疗监测、反馈、回溯工具。

2.2.5 数据集与外部数据源的连接关系 为减少产品与数据源耦合度,一是将与患者VTE评估相关的特征因素数据全部提取并转存于系统本地,增强系统内聚性,但会导致数据更新延时和不一致的现象;二是在外部数据源中构建VTE危险因素特征数据视图,系统只处理数据视图,优点是数据更新及时,但会降低系统内聚度,增加与外部数据源耦合度。

2.3 关键技术验证

2.3.1 非结构VTE特征因素数据的自然语言处理与语义分析 利用自然语言处理过程中构建的字典,对数据中非结构化的医学命名实体进行识别,通过语义分析提取关键字,将非结构化的数据结构化,使数据中描述更为准确、统一。解决目前数据部分医疗实体名过长、类别不均衡、数据格式不统一、本地转存冗余等问题,构建准确高效的VTE数据库。

2.3.2 多量表加权因子累加算法模型优化 机器学习的智能数据挖掘分析模型,参考各类专科防治指南,采用数据挖掘与统计分析技术对多维危险因素进行特征整理,对VTE特征数据集分别用多量表加权运算,实现不同量表互相验证。

2.3.3 预防诊疗辅助决策方案生成技术 根据VTE防治指南和医院防治方案,生成与危险分级相对应的预防措施、诊治方案,医务工作者可以对所生成的方案进行更改,使诊断更加合理。

2.3.4 防治态势图与交互感知技术 统计分析数据后生成动态视图,根据统计分析结果绘制出不同分辨率(颗粒度)的VTE防治态势图,如用表格显示评估结果、评估历史,利用折线图显示评估趋势等。

2.3.5 防治质量监控与反馈跟踪模型 利用统计功能汇总数据,包括确诊病例、疾病发生情况、不同类型血栓分布情况,同时可以分布图、模块化等方式显示评估、预防、治疗质量以及需要重点关注的患者,提供直观的观察体验。

3 系统设计

3.1 流程描述

经过多次调研与沟通,梳理出院方VTE防治业务流程,见图1。患者入院后,相应专业科室医护人员利用医师问诊、检验检查等采集患者病情数据,生成相应病情数据集(如电子病历、医嘱、护理记录等)。VTE系统从患者结构化或非结构化数据集提取VTE危险因素数据,整理形成规则的VTE数据库。VTE系统充分利用数据集进行动态风险评估,划分为高、中、低危险等级并提出预防措施、诊治方案的辅助建议。对中高危患者,采用检验检查等手段进行确诊。VTE系统在预防诊治时提供治疗方案建议,医护人员对建议进行人工干预调整,开展VTE诊疗活动。院方医疗质量监控人员根据医院VTE防治标准规范对全院相关科室实施全程闭环监测、反馈和跟踪,分析院内各专科VTE防治现状,对医护人员VTE防治执行情况进行考评。

图1 VTE防治业务流程

3.2 系统架构

3.2.1 物理结构 VTE系统部署于医院医疗质量监控服务器,基于浏览器/服务器(Browser/Server,B/S)架构,利用Web服务页面向院内各专业科室提供VTE风险评估与预警监控服务,及时跟踪反馈VTE防治变化情况。VTE系统物理结构,见图2。

图2 VTE系统物理结构

3.2.2 逻辑框架(图3) 即在软件开发的标准规范体系、安全保障体系下,实现对VTE防治业务数据源封装处理,为医护、质控管理人员提供接口。

图3 VTE系统逻辑框架

3.2.3 技术结构 采用国家标准和业界认可的软件开发技术架构保证VTE系统的可移植性、兼容性和稳定性。VTE系统技术框架主要包括物理层、基础架构层、系统架构层、应用架构层和展现层以及所采用的技术和应用特点等,见图4。

图4 VTE系统技术框架

3.3 功能模块(图5)

图5 VTE系统功能模块

3.3.1 概述 系统输入:患者VTE特征数据集、医疗质控管理命令。系统输出:患者VTE风险评估分级、出血风险评估分级、预防措施建议、医院VTE防治统计数据集。在VTE系统运行过程中各模块分别实现不同功能,为完成任务,各模块之间存在消息、数据交互,具体连接关系,见图6。

图6 VTE系统模块连接关系

3.3.2 患者数据采集 对需进行VTE风险评估的患者,从电子病历、医嘱、护理记录等数据源中提取与VTE相关的危险因素特征数据,进行结构化整理。

3.3.3 系统数据库 为便于数据统一管理,减少因多数据源而产生的接口与逻辑冗余等问题,构建VTE系统数据库。该数据库主要用于存储从外部数据源采集并结构化的患者VTE特征、VTE防治统计、历史数据等。

3.3.4 特征数据处理 主要用于分析和处理与患者VTE风险评估相关的特征数据。

3.3.5 风险评估与分级 根据患者所属的专科及相应评估要求进行VTE风险评估量表打分与计算,再参照评估结果对患者进行风险分级。依据分级结果判定是否进行出血评估,或是调用其他功能模块。

3.3.6 预防与诊治 参考VTE防治指南和医院防治方案,生成与危险分级相对应的预防措施、诊治方案,构建关联规则,以便于其他功能模块调用。

3.3.7 质量监控 功能相对独立,主要为医疗质量监控部门提供院内、各科室的VTE防治状态监测、工作效果评价、信息反馈、跟踪等应用功能。

3.3.8 数据统计与展示 为质量监控模块提供相应服务。通过调用VTE系统数据库计算出确诊率、评估率、预防率、治疗率等统计数据,对这些数据进行进一步深度挖掘与分析,利用准确、直观的可视化方法展示给终端用户。

3.3.9 数据挖掘分析算法 利用先进的数据挖掘、机器学习等算法对VTE系统数据库中的各类数据进行不同深度分析,寻找并构建出可用于自动化VTE防治的智能VTE特征数据监测算法模型,应用于系统。

3.3.10 外部医院信息系统数据交互 VTE系统对外的数据接口,通过其将患者VTE风险评估、预防措施、诊治方案等信息推送到三级医师、质量监控信息系统中,提供一种与其他医疗信息系统协同工作的方法。

4 结语

VTE风险评估与预警监控系统解决了目前软件存在的类型、实现方式、核心功能单一等问题,具体表现为实现多源数据采集与分析、VTE风险评估模型、预防诊疗方案分级、防治信息统计与可视化等,规范院内VTE评估、预防、诊断和治疗过程,在一定程度上降低误诊率。随着技术发展,希望后期利用机器学习、数据挖掘等技术设置符合中国患者体质的量表,分级关联各科室诊断信息,构建患者个性化治疗方案,进一步提高医疗质量。

猜你喜欢

数据源数据挖掘分级
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
Web 大数据系统数据源选择*
分级诊疗路难行?
基于不同网络数据源的期刊评价研究
分级诊疗的“分”与“整”
分级诊疗的强、引、合
“水到渠成”的分级诊疗
基于真值发现的冲突数据源质量评价算法
分布式异构数据源标准化查询设计与实现