现行国行标中的心电数据库
2020-07-03王茜梁振士魏红霞
王茜,梁振士,魏红霞
北京市医疗器械检验所·医疗器械检验与安全性评价北京市重点实验室 (北京 101111)
1 心电数据库
心电图(electrocardiogram,ECG)是临床非创伤性诊断心律失常和传导异常的金标准和常规诊疗技术手段。随着医疗技术的发展和进步,心电信息的采集、处理分析、存储、检索、传输等技术问题和标准化问题已基本解决。近年来,美国国家卫生院及美国心、肺、血液研究院(National Heart, Lung and Blood Institute,NHLBI)特别专家小组给出了开发心电数据库的推荐标准。
目前,国内外都建立了许多心电数据库,国外较为权威的心电数据库有美国麻省理工学院与贝斯以色列医院(Massachusetts Institute of Technology-Beth Israel Hospital,MIT-BIH)心律失常数据库[1]、美国心脏协会(American Heart Association,AHA)心律失常数据库[2]、欧洲心电图通用标准(common standards for electrocardiography database, CSE)心电数据库[3]等。相比于国外心电图数据库,国内的心电数据库影响力较弱,而近些年国内发展的心电数据库有中国人心血管疾病数据库[4](Chinese cardiovascular disease database, CCDD,旨在科研、在线收集ECG)、杭州市第一人民医院的远程心电监护系统的心电数据库(旨在管理医院的心电信息)[5]、自动诊断心电数据库[6]、中国北方成年人标准十二导联心电数据库[7]等。
作为医学数据库的一个重要组成部分,心电数据库是宝贵的医学资源,对于医学研究、临床诊断、疾病过程和预后判断具有重要价值。心电数据库可用于临床研究,如提供心血管流行病的研究资料,为建立不同年龄、性别、种族的正常人群ECG 特征提供依据[8],探讨在某种心血管疾病情况下的ECG 诊断标准和评估心电图的潜在价值等[9-10]。
与此同时,心电数据库也是发展和评估心电自动分析的基础,是心电类产品设计研发、测试和客观评价时必须参考的重要指标[11]。随着相关技术的发展,越来越多的心电类设备具有ECG 的自动分析功能,即可自动测量ECG 中有临床意义波形的时间间期、幅度,和(或)可以对ECG的形态和节律进行自动识别、诊断和解释。然而,不同的自动分析系统有着各自的技术方法和特点,导致在测量的振幅、时间间期、诊断和解释报告中可能会存在差异,所以在医用心电类设备现行且有效的多个国家标准、行业标准里,都出现了心电数据库的内容。
2 现行有效国行标中的心电数据库
2.1 概况
在针对心电类设备的现行国行标中,涉及检测和评估使用心电数据库的有:GB 9706.8-2009 医用电气设备 第2-4部分:心脏除颤器安全专用要求(采标于IEC 60601-2-4:2002,等同采用)[12]; YY 0782-2010 医用电气设备 第2-51部分:记录和分析型单道和多道心电图机安全和基本性能专用要求(采标于IEC 60601-2-51:2003,等同采用)[13];YY 0885-2013 医用电气设备 第2部分:动态心电图系统安全和基本性能专用要求(采标于IEC 60601-2-47:2001/2006,修改采用)[14]。这些标准中使用心电数据库的目的,都是为了不同程度地评价心电设备的自动分析和诊断性能。对于产品种类和预期使用方式的不同,心电数据库的涉及程度和实际使用验证过程也有所不同,如可以采用制造商自有心电数据库提供说明,或者是经专家确定的公认参考心电数据库进行测评。但无论哪种数据库,均应符合现行国行标要求,并规范使用。
2.2 参考数据库
现行国行标中的参考心电数据库,基本都是20世纪80年代以来公认权威的测试心电数据库。为了更好地理解标准中的要求,本研究对纳入标准的心电数据库从由来、内容和数据特征方面,进行进一步剖析。
2.2.1 MIT-BIH 心律失常心电数据库
MIT-BIH 心律失常心电数据库是由MIT 联合BIH 提供的长时心电数据库,是用来评估心律失常检测器性能的第一个被广泛使用的包含标准测试材料的数据集。该库除了含有房性、室性节律、传导阻滞、传导异常、异位搏动、起搏信号等,还涉及某些药物治疗后的心电信号。数据来自于实际患者的长时程双通道Holter 记录,每通道采样率360 Hz,11 位转换精度(±5 mV 范围)。库中数据48 条,每条时长约30 min,有详尽的逐拍标注信息。
2.2.2 AHA 数据库
AHA 数据库由美国心脏协会提供,美国心、肺、血液研究院资助。该数据库也是长时心电数据库,可用于评估室性心律失常自动分析算法的准确性。其数据均来自于实际患者,第一部分1982年发布,1985年完成。目前,AHA 数据库可用的数据为80条,每条时长2 h 、且为两通道信号(由Holter 记录),每通道采样率250 Hz,12位转换精度(10 mV 范围),每条数据的后35 min 有详尽的逐拍标注信息。根据室性异位心拍的高发程度,库中心电图分为8大类,每类10条。
2.2.3 CSE 心电数据库
CSE 心电数据库由欧洲心电图标准化工作小组组织不同国家的心血管专家耗时3年(1985年始)建立而成,其包含三导联库、多导联库(11导)和诊断库(1 220例,15导)。库中的数据是短时10 s ECG 记录,除健康人群外,还包含了经临床检查(包括介入性检查)证实的左室肥大、右室肥大、各个部位的心肌梗死及心室肥大合并心肌梗死等各种患者的ECG,其中,前两个数据库中有ECG 各波波形时限详细信息,可用于评估多导联波形识别性能,诊断库可用于评估ECG 自动诊断的性能。
2.2.4 NST 数据库(MIT-BIH,noise stresstest database)
NST 数据库[15]数据来自MIT-BIH 心律失常数据库,用于在Holter 记录中较常见和较典型噪声的测试,包含的噪声类型有基线漂移、肌电干扰和电极移位干扰,库中含12条两通道Holter 数据,每条时长约30 min,有详尽的逐拍标注信息。
2.2.5 CTS-ECG 测试集
1989年,欧盟开始实施CTS-ECG 项目,旨在减少计算机程序在心电波形测量上的广泛变异,评估和改进计算机解析程序的诊断分类。库中数据都是数学函数生成的ECG记录,并非来自真实个体,包含校准心电图CAL13条和分析心电图ANE3条,前者是所有导联的信号均完全相同,后者各导联波形形态各不相同,更接近实际的心电图。
2.2.6 CU数据库(CU ventricular tachyarrhythmia database)
CU 数据库[16]中数据均由Creighton 大学心脏中心收集,与MIT 数据库一起提供,包含有室性心动过速、心室扑动和心室颤动类型,共35条,每条约8 min 的单通道数据,每通道采样率250 Hz,12位转换精度(10 mV 范围),有详细的节律变化标注信息。该库可用于评估心电设备对室性心动过速、心室扑动和心室颤动节律自动诊断的性能。
3 使用心电数据库检测和客观评价心电设备自动分析性能
上述3个现行国行标中,涉及心电数据库的测评概况见表1。
3.1 GB 9706.8-2009
检测时,仅需验证技术说明书。标准中无指定心电数据库,但条款6.8.3aa)3)a)心电数据库试验报告中要求:用于验证心律识别性能的心电数据库至少应包括不同幅度心室颤动(ventricular fibrillation,VF)心律;不同频率和QRS 波宽度室性心动过速(ventricular tachycardia,VT)心律;各种窦性心律包括室上性心动过速、心房颤动和心房扑动,具有心室期外收缩特征窦性心律,停搏和起搏器心律。制造商自做验证时,可以采用标准数据库,也可以使用其他数据,只要达到涵盖标准要求的心律类型即可。
表1 现行国行标中心电数据库使用概况
3.2 YY 0782-2010
条款50.101利用CTS-ECG(16条)和CSE 心电数据库(100条)验证心电设备的自动测量性能:从幅值测量准确性、间期测量准确性方面,使用待测设备对两库中的特定心电数据进行测量,并对测量结果以限值、可接受的平均差、可接受的标准差方面进行衡量。
条款50.102验证心电设备的自动解释性能:ECG 的自动解释准确性从轮廓(形态)自动诊断、节律自动诊断两方面来验证;标准中对这两方面验证的方法都无指定的参考数据库,可以采用制造商自有心电数据库,但标准对验证数据提出了具体要求。
3.2.1 轮廓(形态)自动诊断验证
对有心电自动形态分析功能的心电设备进行测试的ECG,必须从该设备预期使用的那些健康人群和心脏病患者采集而来;用于测试的心脏疾病在采集人群中的流行性应与其在该心电设备的预期使用人群中的流行性相似(使用人群中的低流行性心脏病可以不包括在测试范围内,但要在随机文件中说明哪些心脏疾病被排除在测试范围之外);无论是从健康人群还是心脏疾病患者中采集的ECG,均必须采用非ECG 的方法来确认其正常/患心脏疾病的真实性;对于某些疾病(如正常、陈旧性心肌梗死、心室肥大)可以采用CSE 诊断心电数据库验证;依据设备对不同轮廓(形态)的ECG 给出的自动解释,与库中的标注信息进行比对,测试结果准确性以灵敏度、特异度和阳性预测值表示。
3.2.2 节律自动诊断验证
对有心电自动节律分析功能的心电设备进行测试的ECG,必须从该设备预期使用的目标人群中采集而来。其数据库必须包含1 500个窦性心律(正常窦性心律,窦性心动过缓,窦性心动过速等)ECG 和100个心房颤动ECG。所包含的窦性和非窦性心律心电图的比例必须与心电图机预期使用目标人群相符合。这些ECG 的真实节律(即用于心电设备做比较的“金标准”)必须由至少一名经过培训的心电专家,在仔细评审至少10 s、至少两个同时描记心房活动的导联(如Ⅱ导联和V1导联)的ECG 之后确定。依据设备对不同节律的ECG 给出的自动解释,与“金标准”比对,测试结果准确性以灵敏度、特异度和阳性预测值表示。
3.3 YY 0885-2013
此标准中涉及的参考心电数据库较多,具体需要哪些数据库验证取决于心电设备声称的自动分析功能,见表2。
表2 YY 0885-2013性能验证中使用的心电数据库
这些数据库中除了心电图数据,同时还有临床心电专家详尽的逐拍标注信息。验证时,将库中测试数据输入待测心电设备,从而得到待测设备对这些数据给出的自动分析结果,再与库中的参考的标注比对;其次,标准要求测评的比对程序应使用MIT-BIH心律失常数据库程序(bxb、rxr、epic和mxm)、MIT 发布的最新版本或有同等功能和输出的程序;最后,进行整库统计,按不同项目分类(如QRS 识别功能等)对其适用的每个心电数据库进行整理,以灵敏度和阳性预测值结果表示心电设备该类项目的自动分析准确性。
综上所述,在验证医用心电类设备自动分析和诊断性能时,需根据不同要求和应用目的进行。现行国行标中除了使用指定的参考心电数据库检测的情况,还包含无指定心电数据库,但对测试用数据有特殊要求的情形,如制造商自己创建的心电数据库,无论是采用哪种形式的心电数据库,均需要符合标准中的相关要求,并且按照标准要求的方法使用数据库,才可保证验证结果的有效性和评价的客观公正性。
心电数据库是量化评估医用心电类设备自动分析准确性的一种很好的素材。这种通过心电数据库的量化评估方式,可在很大程度上反映医用心电设备面对真实世界的自动分析能力;另外,需认识到心电数据库在研发阶段,若使用将来评估的测试心电数据库进行算法的训练,易造成算法“过适应”,而性能表现虚高,可能在实际应用时,准确性性能下降。在这种情形下,评估结果的外推风险很可能会增加。
随着行业技术发展的需要,出现了一些新的心电数据库,如合并腕部光电描记容积法(photoplethysmograph,PPG)信号和运动噪声的单导心电数据库[17]等,可以为可穿戴类设备自动分析识别的研发测试提供素材,但目前这些尚未纳入标准体系。与此同时,IEC 三版标准里的心电数据库也有一些调整,如IEC 60601-2-47-2012 (Medical electrical equipment-Part 2-47: Particular requirements for the basic safety and essential performance of ambulatory electrocardiographic systems,目前尚无与之对应的现行国行标)中,在原来数据库基础上增加了European ST-T 心电数据库,其可以用于评价心电算法自动分析ST 和T 波改变的能力。这些心电数据库和标准的方向也都值得进一步关注。