远程医疗信息系统中数据质量控制的研究
2017-07-24姚远尚国伟费晓璐
姚远,尚国伟,费晓璐
首都医科大学宣武医院 a.信息中心;b.科研处,北京 100053
远程医疗信息系统中数据质量控制的研究
姚远a,尚国伟b,费晓璐a
首都医科大学宣武医院 a.信息中心;b.科研处,北京 100053
本文针对远程医疗中传输和存储的数据进行分析,发现远程医疗中涉及数据质量的相关问题,如数据缺失、数据重复、数据格式不一致等等,并将远程医疗过程中出现的相关数据问题进行分类,针对各个类别的问题尝试通过归纳计算、聚类、回归函数或利用模糊动态匹配等技术找出相应的解决方案,提高了远程医疗的数据质量,使得远程医疗的有效实施和应用得到了保证。
远程医疗;数据质量;数据交互;模糊动态匹配
引言
目前,随着卫计委推广分级诊疗的力度逐渐加大,基于网络的远程医疗已经成为各大医院关注的重要业务分支。到医院看病就医的传统医疗模式已经越来越无法满足人们的医疗需求。受到高水平医疗专家数量的限制,他们不可能为了满足人们更高水平的医疗护理而离开自身的重要岗位。并且乡村的医院和医生更加缺乏,跑到大城市就医不仅花费大量的金钱还有宝贵的时间。远程医疗的建立和应用对于那些不用住院治疗的症状较轻的患者带来了极大的方便[1-3]。从长远来讲,远程医疗模式是一种颠覆性的医疗模式,推动了互联健康,像现代交通枢纽和高速公路那样,将医疗、养老、子女关护老人,父母挂念孩子等亲情无障碍衔接在了一起[4]。
远程医疗技术是网络科技、医疗与多媒体等多项技术相结合的产物,它是一个开放的分布式应用系统。它以计算机网络通信为基础,通过多种数字传输的方式,实现对医疗技术的共享、远程诊断以及音频信息的传输、存储、查询、比较和显示。与传统的临床医疗相比,远程医疗会诊促进了医疗资源的均衡化。一些地方医院诊疗水平有限,在救治过程中往往会遇到一些难题,通过远程医疗诊断系统,可尽快地解决在救治患者过程中所遇到的困难,既可以在一定程度上提高地方医院的业务水平,也会提高远程会诊医院的声誉及诊疗水平。在传统临床医疗模式下,患者只能等到查房会诊时进行充分沟通,病史资料也存在丢失遗漏等问题,而远程医疗诊断可确保病患者与医生进行更方便更快捷的沟通,同时病史资料的保存也得到了极大的改善。
1 远程医疗发展概况
1988年,美国提出远程医疗系统应作为一个开放的分布式系统的概念。美国学者对远程医疗系统的概念定义如下:远程医疗系统是一个整体,通过计算机技术和通信技术的特定人群提供医疗服务。该系统包括远程诊断,信息服务功能,远程教育等,它是以计算机和网络通信,多媒体技术在医学数据,远程视频,音频信息的传输,存储,查询和显示[5]。1988年12月,在前苏联亚美尼亚共和国发生了强烈地震,在美国和苏联太空生理联合工作组织,在美国的支持下,美国宇航局的第一个远程医疗国际,实现一家医院亚美尼亚与美国四家医院通信联通和远程会诊。乔治亚州教育医学系统是目前最广泛,在世界上最大的远程教育和远程医疗网络,能够实现有线、无线和卫星通信活动,远程医疗网是其中的一部分。在欧洲,远程医疗系统的大规模推广和欧盟已经组建了3个生物医学工程实验室,10个大型公司,20个病理学实验室和120个终端用户在推广应用远程医疗技术。澳大利亚、南非、日本等国家也进行了各种形式的远程医疗活动。远程医疗可以跨越国际的政治、文化、社会和经济的界限。近年来,远程医疗模式的发展已突破早期受限于网络,视频通信等硬件条件,更多地向系统化、集成化和平台化顶层设计发展以及精准管理,更是强调资源优化整合应用升级[6]。
以美国退伍军人保健局为例,2014年完成了两百万次远程医疗服务[7];位于北卡罗莱纳州的凯撒医疗机构分部预测,2016年该机构通过远程模式提供的医疗和健康管理的患者次数将超过患者和医生面对面看诊的人次数[8]。同样,梅奥医疗中心也预测,到2020年该中心将为全球患者提供超过两亿人次的医疗服务,其中大部分患者来自世界各地,主要通过远程模式实现诊疗和随访、以及疾病管理[9]。
我国的远程医疗技术起步较西方发达国家晚,但发展很迅速,可以分为3个阶段:
(1)概念实施起步阶段。利用远程通信的方法达到会诊咨询的目的。这是最初的远程医疗的概念。1986年广州远洋航运公司的电报会诊,到1988年解放军总院通过网络卫星和德国一家医院进行神经外科远程病例讨论再到北京大学的基于互联网的铊中毒的远程病例讨论[10],我国的远程医疗会诊渐渐的发展起来。
(2)建立远程医疗网络阶段。在我国政府和卫生部直接领导的支持下,金卫医疗网络在1997年正式开通。网络开通以来,已经为全国各地几千例疑难急重患者进行远程会诊,组织国内外医疗学术交流、科研教学、手术观摩等促进了我国远程医疗的发展。
(3)利用网络发展普及阶段。近年来,随着互联网技术的高速发展,出现了基于浏览器工作站的远程医疗技术产品,利用互联网向广大患者提供远程会诊及寻医问药的咨询。这种模式的出现,真正地体现出资源共享的高效,紧急情况能及时处理,提高了医院的能效和节省患者的开支。
我院作为国家脑防委远程卒中会诊中心的架构,见图1。该中心主要包括:远程卒中救治指导、远程疑难病会诊、远程康复会诊、远程影像会诊、远程教育培训、远程手术示教、国际交流、学科建设等。全国对接医院2000余家,其中三甲医院365家、二甲医院1821家。全国已对接省份包括:河北、河南、山西、陕西、内蒙古、黑龙江等17个地区。参与会诊专家80余名,包括:神内、神外、介入、功能神外、康复、疼痛、胸外科、心脏科、骨科、血液科等17个科室。开展了千余例远程疑难病会诊,数十例远程静脉溶栓会诊及远程介入手术指导及远程手术示教。此外该中心与美国匹兹堡大学远程医学中心、南卡莱罗那医学中心均有合作,现每月至少进行两次国际间的学术交流及病例讨论。
图1 脑卒中会诊中心网络架构
2 远程医疗系统中的数据质量
随着网络技术的发展,支持远程医疗的产品越来越多,虽然从技术上来讲,无论是文字,还是图片、视频的传输都已经不是障碍,但是真正能够体现医疗管理特色,能够把远程医疗相关数据妥善管理起来,帮助医生方便快捷的进行诊断以及后续的研究,还有一定的距离。
总体来说,远程医疗中数据主要以4种方式进行交互,见图2。本文针对我院在建设远程医疗系统过程中在数据质量控制方面积累的一些经验教训进行探讨。
图2 远程诊疗数据交换的形式
2.1 影像数据的管理与质控
医学影像文件对于诊断具有非常重要的意义,但是对图像质量有很高要求,理想状态下应该采用申请端发送原始DICOM文件传输入会诊端的PACS系统,再由会诊端本地的DICOM浏览器打开这种模式。
由于种种原因,很多的医学影像会诊系统对DICOM影像的支持力度有限,很多是以JPEG图像压缩打包,FTP上传等形式进行影像数据的交换。而这种医学影像交互的形式,可能会影响远程诊断的质量。同时,JPEG图像没有附带任何患者、检查、序列、影像级别的医学信息,无法加入到会诊端当地的PACS系统,影响会诊数据档案的完整性,造成关键影像数据的保存缺失。
即使双方医疗机构都采用DICOM格式的原始影像进行信息交互,由于医疗机构采用的PACS系统不同,对一些DICOM影像私有的属性以及加密处理方式可能有差异,虽然影像文件有标准的格式,可还是很有可能出现DICOM文件不能打开的问题。这种情况下需要双方协商,共同使用对双方机构PACS系统导出文件兼容性均较好的第三方浏览器,而且导出DICOM文件时需要注意,一定要导出经过解密的文件。
2.2 文本形式数据的准确性、完整性及一致性
目前,随着国家对分级诊疗的大力推动,医院对远程医疗过程中的患者人口学信息以及诊疗信息的重视程度越来越高,部分医院将远程医疗的患者信息也等同于医院诊疗患者信息进行归档,这也是未来区域医联体借助远程医疗系统开展分级诊疗必备的信息支撑。然而,目前远程系统建设缺乏统一的医疗规范和技术标准。参与远程医疗的各个医疗部门的软硬件条件各异,部门、单位特点不同,势必造成多种关系数据库共存的局面。多种系统及异构数据库的存在严重限制了数据共享和交互的范围。现阶段远程医疗缺乏统一的技术标准和医疗规范。由于参与远程医疗的各家医疗机构的规模不同,使用的医院信息系统不一样,加之各地区网络传输的信息通道的差异,造成医疗信息不能及时有效的共享,实现医疗单位全方位、多元化联网比较困难[11]。同时,远程医疗各区域及各系统比较分散,数据集成中可能会牵涉到HIS、RIS、PACS、LIS等各个方面,此外,由于医院信息系统建设的时间跨度较长,各应用及软件且没有可以参照的统一的建设标准和数据标准,部分系统没有采取机构化的方式存储数据,个别系统甚至还在使用文件方式存储数据。多年的数据维护、搬迁,输入时的缺乏经验,再加上系统功能模块是逐步上线,这都导致了远程医疗数据会出现数据的缺失和不完整等一系列问题。
(1)在医疗信息系统中数据中会发生“缺失”的情况,若缺失的为远程医疗相关的关键数据,则数据缺失情况会直接影响到远程医疗的效果。如果多个数据段的属性值空缺时,我们可以选择忽略该数据。对于重要的不能被忽视的数据,尽量用具体的数值来填补空缺。对于年代的空缺可能会尝试按相应的记录年份来填补空缺,或者可以用平均值来填补[12]。
(2)因为时间各系统的数据进行集成,所以会出现数据重复的现象。造成数据重复的原因有拼写错误,如“李四”姓名被错写成“L四”,比如“北京大学”和“北大”。这些重复数据的记录可能导致建立错误的数据挖掘模型,会对远程医疗后期数据的决策分析产生很大的影响。所以,检测和消除重复数据是提高数据质量要解决的主要问题之一。我们可以尝试采用模糊动态匹配技术让系统自动发现重复数据,在分析原因后可采用剔除某数据源记录单一信赖单数据源数据,或采用合并汇总记录的方式进行处理[13]。
(3)远程医疗往往衔接的是两个不同的院端系统,各系统的数据很可能会存在数据格式不一致的现象,如系统内日期数据的格式,假设我们认为正确的日期格式为1996/5-1997/6,错误的类型有1996/5.1997/6符号输入错误、1997/6-1996/5顺序颠倒等。我们要为该类数据制定统一的规则,将所有的日期修改为统一的格式。如果程序提供了规则库,可以从规则库中调用模板如替换、抽取、字符串比较大小等[14]。当然,最理想的状态时各个医疗机构都遵从同一类数据格式和规范。美国退伍军人保健局就明确要求各个相关医疗机构尽量可能按照HL7标准提供数据元素,认为这些可以协助改善他们内部的电子病历数据的完整性、准确性和一致性[15]。
(4)各医疗机构可能使用了不同的基础字典,导致诊断等核心数据无法归类。如不加处理,将影响数据质量。针对此类数据问题,后处理的方法只能是对既往数据进行分布分析,请相关专家对词频较高的词汇进行归类,建立后台对照的知识库。可以尝试使用查找表的方法,按各系统的数据字典、数据标准格式建立查找表,并在数据清洗中将数据对应相应的表进行匹配[13]。也有一种方式是由区域诊疗的中心医院发布一套比较权威的基础数据字典,各个会诊发起端自行于本院的字典进行匹配后再进行数据交互。
2.3 视频的连续性和实时性
会诊中视频信号是非常重要的环节,有经验的医生需要通过视频与患者互动,查看患者的反应,因此视频的连续性和实时性非常重要。视频会议的整体是基于网络构建的,通信质量的好坏严重影响着视频会议的效果。网络质量不好的情况下,视频会出现大量的马赛克或者声音有很大延迟且不清晰,这直接影响着对病人进行问答和查体等操作。所以一般都采用专线的方式来保证会议的清晰度和流畅度。除了网络之外还有辅流的问题,双方通过发送双流,是双方可以共享某台电脑或者设备的桌面,这样可以使得有一些不太方便传输的文件可以让双方同时进行浏览,已进行讨论,但是辅流的清晰度以及显示辅流的显示器是需要注意的,如果双方共享的是DICOM影像,就要考虑清晰度以及显示器是否为诊断级别。
总之,随着卫计委大力推动区域医联体和分级诊疗,远程会诊系统必将成为医院重点发展的业务系统之一。从功能上来讲,远程会诊系统的软硬件功能应该无缝融合,就像手术机器人能够充当医生在手术间内的手一样,远端的视频设备也应该能够在配合医生在会诊系统中的操作,充当医生在远端的眼睛。从数据角度来讲,远程会诊系统中的患者就诊记录也将成为医联体中患者健康档案中的重要组成部分,因此其数据的标准性、规范性、完整性、真实性、一致性应该按照医院内的业务系统数据同样要求。因此,远程医疗系统中的数据质量控制,也将成为医院数据集成与数据利用的必要前提工作。
2.4 家用可穿戴医疗设备产生数据的准确及可用性
随着便携式及可穿戴医疗设备技术的发展和产品的普及,未来可穿戴设备一定是远程医疗的重要数据来源之一。但是这些家用设备所提供的心率、血氧浓度、舒张压、收缩压、肺活量等数据,比起传统医院检查所采集的数据,其数据采样频率要大得多,如果其质量不能进行合理的控制和筛查,就有可能作为错误数据误导远端的医师,对患者身体状况做出错误的判断。例如,肺活量数据采集,就应该参考美国胸科协会(ATS)和欧洲呼吸协会(ERS)颁布的肺功能测量的强制标准,一旦用户在使用肺活量测量设备时采用了不正当的技术,设备就应该拒绝采纳这个测量结果,并把拒绝提示发给用户。
3 结语
总之,作为一个新兴的诊疗模式,远程医疗具有显著的合理调配医疗资源,为偏远地区提高诊疗水平等优势,作为必要的技术支撑手段,远程医疗信息系统是不可获取的一部分[16]。我们在重视建立诊疗过程的规范的同时,不应该简单的认为远程医疗信息系统就是简单的医生使用的视频会议系统,应该从医疗和研究角度出发,尊重患者全生命周期的诊疗纪录,妥善保管并记录远程医疗中的信息数据,把控数据质量,为未来的相关数据分析和利用打下坚实的基础。
[1] 诸强,王学兵,胡宾,等.无线远程医疗系统[J].北京生物医学工程,2004,23(3):225-227.
[2] 廉世俊,胡大可.远程医疗中的通信问题[J].国外医学生物医学工程分册,1999,22(5):263-269.
[3] 白净,张永红.远程医疗概论[M].北京:清华大学出版社,2000.
[4] Dorsey ER,Topol EJ.State of telehealth[J].N Engl J Med,2016, 375(2):154-161.
[5] 龙志波.DICOM标准下医学影像数据库的建立与研究[D].吉林:吉林大学,2009.
[6] 叶志前,唐保昌,刘进,等.基于B/S模式的远程影像会诊系统设计和开发[J].中国医疗器械杂志,2008,(11):99-102.
[7] VA poised to ramp up telehealth in 2015[EB/OL].(2014-12-23).http://www.mhealthnews.com/news/va-poised-ramptelehealth-2015.
[8] Pearl R.Kaiser Permanente Northern California: current experiences with internet, mobile, and video technologies[J]. Health Aff(Millwood),2014,(33):251-257.
[9] Larsen E,Diamond D.Why Mayo Clinic's CEO wants to serve 200 million patients — and how he plans to do it. The Advisory Board Company[EB/OL].(2014-07-23).https://www.advisory.com/dailybrie fi ng/2014/07/23/lessons-from-the-c-suite-mayo-clinic.
[10] 农智红,刘郦,覃丽群.我国远程医疗技术演变过程及其发展趋势浅析[J].沿海企业与科技,2007,(4):47-48.
[11] 张睿,罗绯,童林.我院远程医疗工作的现状与发展[J].西南军医, 2007,9(3):122-123.
[12] 熊侃霞,宋涛,张亮,等.市场在医疗服务资源配置中的缺陷分析[J].中国卫生事业管理,2010,27(5):313-315.
[13] 赵霞.基于数据挖掘技术的电子病历数据质量分析系统的研究与实现[D].广州:华南理工大学,2010.
[14] 刘静,刘丽红,张竹绿,等.使用数据清洗技术进行中医药数据仓库质量控制研究[J].中国数字医学,2012,7(4):81-82.
[15] Christine Sweeny.Data Quality: Demographic Data Accuracy and Completeness[EB/OL].(2016-04-29).https://www.vitl.net/ blogs/ehealth/data-quality.
[16] 刘清发,孙瑞玲.远程医疗在医养结合中的应用探讨[J].中国医疗设备,2015,30(5):70-72.
本文编辑 王博洁
Research on Data Quality Control in Telemedicine Information System
Y A O Y u a na, S H A N G G u o-w e ib, F E I X i a o-l ua
a.Information Center; b.Department of Scientific and Research, Xuanwu Hospital, Capital Medical University, Beijing 100053, China
This paper analyzed the data of telemedicine, and some issues related to data quality were found, such as the lack of data, repetitive data, inconsistent data format and so on. Then these issues were classi fi ed. In view of each category of issues, we attempted to fi nd solutions by inductive calculation, clustering, regression function or the fuzzy dynamic matching techniques, which improved the data quality and ensured the effective implementation and application of telemedicine.
telemedicine; data quality; data interaction; fuzzy dynamic matching
R197.324
C
10.3969/j.issn.1674-1633.2017.07.035
1674-1633(2017)07-0126-04
2016-10-08
2016-10-17
费晓璐,高级工程师,主要研究方向为医学信息化。
通讯作者邮箱:feixiaolu@tsinghua.org.cn