APP下载

基于IPv6的医学影像在线诊断系统设计与实现

2019-12-12赵国桦吴亚平郝惠惠时东阁林予松

计算机应用与软件 2019年12期
关键词:医学影像基层医院自动

赵国桦 吴亚平 郝惠惠 时东阁 林予松

1(郑州大学产业技术研究院 河南 郑州 450001)2(西安交通大学电子与信息工程学院 陕西 西安 710049)3(郑州大学第一附属医院磁共振科 河南 郑州 450052)4(郑州大学互联网医疗与健康服务河南省协同创新中心 河南 郑州 450052)5(郑州大学软件与应用科技学院 河南 郑州 450003)

0 引 言

随着各类影像采集设备逐步在基层医疗机构部署,越来越多的基层患者可以根据临床需求进行医疗影像采集。由于医学影像的诊断主要依靠医务人员专业技能和个人经验,基层医务人员相关技能水平不足,导致漏诊和误诊情况比较突出[1]。

当前主要采用远程会诊的形式,由三甲医院资深医生与基层医生进行病例讨论。随着问诊量的增加,三甲医院的医生也难以应对越来越多的基层远程会诊请求。因此,利用计算机技术对医学影像进行辅助诊断[2-3],可以有效提高医生的工作效率,推进分级诊疗的落地。另一方面,由于医学影像数据量较大,受网络传输速率的限制,医疗数据传输速度较慢,影响了临床诊断工作的及时性[4-5],急需一种新的网络传输技术改善医疗数据传输缓慢的困境。IPv6作为新一代的互联网技术能提供高传输速率、高可靠性的网络环境,为当前医学影像的数据传输提供新的途径。

本文的主要目标是为医疗机构设计和开发一个基于IPv6的医学影像在线辅助诊断系统,对基层医院患者上传的影像数据进行初步的自动化分析,为后续医生的诊断提供有价值的参考。系统重点关注如何实现影像数据高速传输、如何实现影像数据标注以及自动化分析。针对医学影像大数据的特殊性,研发基于IPv6网络环境下的医学影像的快速传输技术,利用IPv6网络的优势保证系统数据传输的高效、稳定;综合考虑未来系统分析准确度,合理放置数据标注模块,开发通用性强的标注模式;采用计算机影像组学、机器学习方法,以临床中较为严重的脑胶质瘤影像数据为切入点,使用计算机高通量地提取患者脑胶质瘤影像数据的各类特征,最后训练出高精度分析模型,实现影像数据分析的自动化。

1 相关研究

目前国内外已经有不少针对医学影像的计算机辅助诊断产品。Arterys公司推出的Arterys Cardio DL是FDA批准的第一个用于临床的基于云计算和深度学习的分析软件。可以分析传统的心脏核磁共振图像,进行自动化的心室分割[6];推想科技的智能CT辅助筛查依赖计算机的高速计算能力,有效挖掘肺癌的核心特征点,判断不同序列影像是否存在疑似癌症的特征,实现肺癌的早诊早治[7]。现有产品都是针对某一特定重大病种进行研发;形式上往往是基于客户端的软件或设备,无法直接和在线医疗系统并用;主要用于多家医疗机构远程会诊,没有辅助诊断的功能。

另一方面,现有的医学影像系统主要通过传统的IPv4网络进行医学影像大数据的传输[8]。基层医疗机构的网络条件并不理想,大多采用租用运营商的专线来进行数据传输。目前国内外对于利用IPv6协议进行医学影像大数据传输的相关研究还很少[9]。我国政府正在积极推动下一代互联网的规模部署以及应用研究[10]。随着下一代互联网技术的不断发展,IPv6网络的接入将逐渐普及,研发基于IPv6的医学影像系统,具有较好的应用前景。

2 系统设计

本文设计开发的医学影像在线诊断系统,通过IPv6网络连接基层医疗机构和省级综合性三甲医院。基层医疗机构产生的医学影像数据,通过高速IPv6网络传输到医学影像云平台;在云平台中通过机器学习算法进行自动化的诊断和报告生成;三甲医院的医生对云平台自动生成的报告进行审核,审核后的报告可以传输到基层医疗机构;同时,基层医疗机构的医生还可以通过网络与三甲医院的医生进行病例讨论。

2.1 功能设计

根据服务的对象,医学影像在线诊断系统分为三个部分:基层医院服务端、云端服务平台和三甲医院服务端。系统功能图如图1所示。

图1 系统功能图

基层医院影像工作站将协助医务工作者完成对脑影像的辅助诊断,并就具体病例与三甲医院专家进行沟通交流。具体功能包括:数据采集及上传,利用IPv6网络高速传输通道将患者影像数据(如CT,MRI等)上传到医学影像云服务平台;报告查询,将三甲医院处理过的报告单下载到本地进行查看;病例讨论,与三甲医院的专家就相关病例进行交流讨论。

医学影像云平台采用云架构体系,将基层上传的影像数据经过抽取、同步、清洗、转换汇入医学影像基础数据资源库,实现医学影像数据的大规模存储;利用机器学习、影像组学[11-13]方法实现对影像数据的自动分析并生成报告。

三甲医院影像工作站主要实现对报告审核和病理讨论,主要功能有:病例查看,对云平台上的病例数据进行检索和查看;报告审核,对云平台上基于自动辅助诊断系统生成的报告内容进行审核;病例讨论,与基层医院的专家就相关病例进行交流讨论。

2.2 结构设计

为了实现系统的具体目标,采用分层处理的方式进行系统的搭建,总体分为数据层、网络层、接口层、存储层、处理层和应用层六个层。整个系统的分层结构示意图如图2所示。

图2 分层结构示意图

数据层主要实现对基层医院多源异构数据的整合。该层运行于基层医院影像工作站,目标是实现医学影像在线诊断需要使用的各类格式或非格式数据的统一采集,数据来源包括医院的HIS、LIS、PACS系统等独立系统、各类医学影像、图片等文件。通过对数据进行标准化实现数据的整合存储,便于通过网络层高速传输到云端服务平台。

网络层采用基于IPv6的高性能网络传输协议,充分发挥高速专用信道的优势来进行医学影像数据的高速传输。本文开发的系统网络层采用IPv6协议实现医疗大数据的快速转发,提高传输数据的安全性,减少传输过程中的抖动和丢包现象。

接口层位于网络层上方,实现基层医疗机构与云平台之间的高并发连接和数据高速交换,实现对多源异构数据的统一处理。

存储层采用虚拟化技术,将数据中心的存储资源池化管理,通过负载均衡技术和虚拟化管理软件实现针对存储资源的实时监控、动态调度,提供高性能数据库服务。

处理层将基层医疗机构上传的医学数据经过抽取、同步、清洗、转换汇入医学影像基础数据资源库。结构化数据使用数据仓库进行保存,非结构化数据采用Hadoop分布式存储结构。为了充分保护患者的隐私,利用去隐私技术对医学数据进行处理。

应用层实现云平台管理端、基层医院端、三甲医院端的相关功能,完成业务系统全流程。

2.3 数据流设计

医学影像数据是本系统的数据主体,系统依靠数据传输和处理连接各个功能模块,其数据流向如图3所示。

图3 数据流向图

基层医院负责数据采集,收集到的疑难病症数据经过IPv6高速通道上传到云端服务平台并及时保存,同时数据经过平台内置的分析算法对其进行分析处理,得到该病症的计算机辅助诊断结果,进而生成辅助诊断报告。该报告随后被推送到三甲医院,医生通过查看病例影像,参考辅助诊断报告,对该病例做出最后的诊断,并回传给云端服务器。此时基层医院可以下载该病例的诊断报告。基层医院若对某一病例的诊断结果存在异议时,可与三甲医院进行远程会诊,就此病例进行讨论。

3 系统实现及关键技术

3.1 系统实现

本系统采用河南省教育科研网HERNET提供的遍布全省的专用网络,能够为全省18个地市提供高速的IPv6接入服务,河南省教育科研网网络中心可以为本项目开辟高带宽的专用信道,利用IPv6网络实现快速的影像数据上传。

系统使用C/S架构,客户端系统采用C#基于Winform的页面框架技术进行开发;云服务平台使用Python开发,操作系统选用Linux CentOS 7。

图4展示了客户端的主界面,主要分为三个功能区域:上方为工具栏导航区,包括数据上传、刷新列表、打印报表、下载报告、查看影像、审核上传等功能;下方左边为列表区,显示了患者基本信息,点击可打开相应患者的报告,并在主操作区显示报告内容;下方右边为主操作区,对报告进行相关的操作以及对报告进行病例讨论。

图4 系统操作主界面

数据上传由基层医院来完成。如图5所示,基层医院通过基层医院影像服务端登录,点击“数据上传”,即可将报告通过IPv6网络将影像信息和患者信息传输到医学影像云平台服务端。

图5 数据上传界面

影像数据自动分析生成的辅助诊断结果在三甲医院医生审核报告时附带给出,医生可根据辅助诊断结果对此病例做最终诊断,如图6所示。医生审核报告内容并写下备注信息后即可上传至云服务平台,供基层医院下载查看。

图6 影像数据自动分析与审核

3.2 关键技术研究

基于IPv6的医学影像在线诊断系统在工程化实现中需解决的关键技术主要包括:IPv6数据传输、数据标注、影像数据自动分析。

3.2.1IPv6数据传输

IPv6扩大了IP地址的地址空间,可满足每一台可用的医疗设备配置一个唯一的IP地址,并且通过简单配置即可接入IPv6网络。本系统利用IPv6技术的优势,建立基于IPv6的在线诊断系统,进而改善影像数据传输时的网络质量,满足在线诊断对医疗信息的数据要求。

对于基层医院和三甲医院均使用IPv6网络专用通道的情况,数据直接进行端到端的透明传输。对于之前使用IPv4网络中传输或通信,没有配置支持IPv6网络环境的基层医院或部分三甲医院。若要升级支持IPv6网络,修改配置主要包括:网络通信接口、包含IP地址的系统程序段和配置文件、逻辑脚本、数据库等[14-16],具体如图7所示。

图7 支持IPv6的配置修改

3.2.2数据标注

数据标注是本系统自动分析算法实现的前提。医生对影像数据进行标注后,数据才能作为自动分析算法训练集使用。数据标注模块重点考虑模块放置问题和如何实现数据标注。

如图8所示,数据标注模块有Ⅰ、Ⅱ两种分配策略。策略Ⅰ是将数据标注模块放置在云端服务器,并在系统中内置一个数据自动标注的脚本。数据从基层医院服务端上传到云端服务器后,将依次对数据进行自动标注和自动分析,生成辅助诊断报告发送给三甲医院审核。策略Ⅱ是将数据标注模块放置在基层医院服务端。数据在基层医院收集,同时基层医院医生负责对数据进行手工标注。标注好的数据和原始数据一同上传到云端服务器,云端服务器执行自动分析程序,生成诊断报告发送到三甲医院端查看审核。理论上来说,选择策略Ⅰ更适合本系统,数据标注是一个繁琐的、重复性强的工作,使用计算机自动标注很大程度上减少了医生的工作量。但是实际效果却不理想,目前大多数自动标注程序的准确度还达不到临床水平,数据标注效果较差,直接影响模型训练和诊断报告的结果。反观策略Ⅱ,虽然靠医生手工标注,但是标注的准确度有了保障,为后续模型训练的准确提供了保障。所以,系统将数据标注放置在基层医院服务端,医生使用手工标注的方式对数据做预处理。

图8 数据标注分配策略

本系统数据标注需要使用分割工具处理DICOM(Digital Imaging and Communications in Medicine)格式的影像数据。主要功能包括影像查看、影像分割以及影像保存。具体功能通过开源工具库ClearCanvas进行开发。主要实现过程为:读取DICOM格式的原始图像文件,将原图像转换为位图格式在程序中显示,同时显示原图像属性列;影像标注功能在影像查看的基础上进行开发,通过在位图上勾画闭合线条,实现对病灶区域的分割和抠出,进而实现病灶标注;保存标注好的影像文件。

3.2.3影像数据自动分析

影像数据自动分析算法是本系统实现“辅助诊断+在线诊断”的核心。系统最终将实现对多病种的鉴别诊断,目前系统以脑胶质瘤分级作为切入点,实现对影像数据的自动分析。脑胶质瘤分为四个级别,其中I-II级为低级别(LGG),III-IV级为高级别(HGG)[17]。当前算法主要目标是根据脑胶质瘤的高低级别进行分类。自动分析算法具体流程如图9所示。

图9 自动分析算法流程

历史数据经过医生标注之后,将进行特征工程。利用计算机影像组学的方法大量提取包括一阶统计特征、空间几何特征、纹理特征三大类特征,经过特征降维后,针对降维数据进行模型建立。其中,一阶统计特征16个(主要为描述亮度的标量)、空间几何特征9个(主要为描述空间几何特性的标量)、纹理特征300个(主要为描述病灶内部特征的标量)。使用互信息方法将提取的各类特征进行分组,在各组中计算信息增益,选择增益最大的特征构建降维候选集,最后进行模型训练,生成分类模型。

自动分析算法使用已经训练好的分类模型,可以减少算法本身的复杂度。新接收的影像数据经过标注后即可导入自动分析模块,包括对数据执行特征工程、导入分类模型进行分类,最后输出分类结果。

4 系统测试

本文使用临床影像数据对系统进行功能测试和性能测试。

测试将模拟系统的实际使用情况——数据由基层医院输到云服务器,再由云服务器传输到三甲医院。选择郑州大学两个校区作为数据传输节点,郑州大学南校区模拟为三甲医院端并将云服务器部署在南校区,郑州大学新校区模拟为基层医院,数据由新校区传输到南校区。

三甲医院端节点操作系统选用Microsoft Windows Server 2008 R2 Datacenter,处理器配置为Intel64 Family 6 Model 44 Stepping 2 GenuineIntel ~2400,4 GB内存。云服务器节点操作系统选用Microsoft Windows Server 2008 R2 Standard,处理器配置为Intel64 Family 6 Model 62 Stepping 4 GenuineIntel ~2100,内存4 GB。基层医院端节点操作系统Microsoft Windows 7 旗舰版,处理器Intel64 Family 6 Model 94 Stepping 3 GenuineIntel~2496,8 GB内存。数据传输的缓存区设置为256 K。

4.1 功能测试

本文将测试系统所提供的功能模块是否实现以及各模块功能点是否完善。表1列出了本系统主要功能模块。使用黑盒测试法进行功能测试,包括采用等价类划分和边界值分析测试数据、错误推测法测试功能,同时检查测试结果是否符合业务逻辑,最后评审功能测试结果。

表1 主要功能模块

整个测试过程进行了三轮全面测试以及6次随机测试。整个测试过程未发现崩溃性和严重性错误,但存在一般性和提示性错误。及时反馈功能缺陷并修复问题后,系统在功能上能够满足用户需要。

4.2 性能测试

本节将对核心功能模块的性能测试情况做简要介绍,包括:IPv6环境下数据传输性能以及自动分析算法的性能。

4.2.1IPv6环境下数据传输性能测试

本节将测试在IPv6环境下,六组大小不同的数据包由客户端传输到云服务器的传输速度,对照组设置为测试IPv4环境下传输相同大小数据时的传输速度。

实验传送数据包大小以及实验结果如表2、表3所示。

表2 基层医院端到云服务器的数据传输

表3 云服务器到三甲医院端的数据传输

基层医院数据传送到云服务器测试环境在同城的两个独立校区进行,传送数据量从百兆级到千兆级,涵盖了各类影像数据单元,在IPv4网络环境下传输速度仅有2.33 MB/s,传输一百多兆数据的时耗已经超过1分钟,而在IPv6环境下平均传输速度达到约15 MB/s,传输一百多兆数据耗时仅需十几秒。云服务器数据传送到三甲医院测试环境在同一个校区的不同路由范围内进行,传送数据与基层医院传送到云服务器为同一批数据,IPv4网络下传输速度接近11 MB/s,而处于IPv6网络环境下的平均传输速度达到约63 MB/s。由此可见使用IPv6网络环境传输医学影像数据和IPv4网络环境相比,传输效率有显著提升。

4.2.2自动分析算法的性能测试

自动分析算法为三甲医院医生提供参考性意见,其准确度直接影响医生的诊断。为了验证本系统开发的数据自动分析算法的性能,本节将使用上传到云服务平台的119例脑胶质瘤影像数据对本自动分析算法进行准确率评估。

上传的119例脑胶质瘤数据包括68例HGG和51例LGG,全部数据的分级都由医院病理科确认。自动分析算法部署在新校区云服务器上。测试的分类结果统计在如图10所示的混淆矩阵中。

图10 分类结果的混淆矩阵

图10中,Predicted Label 标签下的HGG和LGG表示本系统智能分析算法对119例脑胶质瘤数据的预测结果,True Label标签下的HGG和LGG表示数据实际的分级结果。为了更具体地说明分级性能的优劣性,引入准确率、灵敏度、特异度、漏诊率、误诊率进行描述,如表4所示。

表4 指标评估

其中,准确度是指测量值与真实值的接近程度,这里表示预测正确的样本数占总样本数的比例,设定LGG为正样本,HGG为负样本。灵敏度描述了识别出的正样本占全部正样本的比例;特异度描述了识别出的负样本占全部负样本的比例;漏诊率了描述未识别的正样本占全部正样本的比例;误诊率了描述未识别的负样本占全部负样本的比例。表中数据显示智能分析算法准确度率90.76%,普通医生的确诊准确率为70%~80%,所以本系统智能分析算法为医疗工作者提供辅助性的诊断信息是可靠的。

5 结 语

本文设计开发了基于IPv6的医学影像在线诊断系统,实现了在IPv6网络环境下医学影像数据的高速传输,同时使用影像组学、机器学习方法实现了对影像数据的自动分析。实验结果表明系统功能相对健全、传输性能稳定和自动分析性能良好。系统能为医生提供可参考的信息,有效减少医生工作量,实现“辅助诊断+在线诊断”新的医疗模式。本文系统以脑胶质瘤的分级作为实例开发,涵盖了远程医疗影像诊断的基本流程,今后可将本模式推广到临床的其他病种,如肺结节诊断等。但系统也存在一些不足和缺陷,例如:系统没有充分考虑大规模并发的数据传输;目前涉及的病种较为单一,有待进一步增加。

猜你喜欢

医学影像基层医院自动
《中国医学影像杂志》稿约
基层医院医疗器械维护和安全管理方法探讨
结合多层特征及空间信息蒸馏的医学影像分割
微生物检验在基层医院感染控制中的应用
医学影像技术在医学影像诊断中的合理运用
腹腔镜下胃袖式切除术在基层医院的运用
影像组学在核医学影像中的应用进展
自动捕盗机
让小鸭子自动转身
自动摇摆的“跷跷板”