OCT影像人工智能读片与医生读片对识别年龄相关性黄斑变性的一致性分析
2022-05-05许斐平汪竟成王莎莎曹婷怡陈新建陈吉利
蒋 炎,许斐平,汪竟成,王莎莎,刘 瑞,曹婷怡,袁 雯,陈新建,陈吉利
0引言
年龄相关性黄斑变性(age-related macular degeneration, ARMD)[1]、糖尿病视网膜病变(diabetic retinopathy, DR)[2]和病理性近视(pathologic myopia, PM)[3]等常见的视网膜疾病已成为全球视力障碍和失明的主要原因。ARMD患者年龄多大于50岁,与年龄、遗传、吸烟、营养、光损伤等多种因素有关,可导致不可逆的中心视力下降。ARMD主要影响黄斑功能,而黄斑是与精细视觉和色觉相关的视网膜中心区域。临床上ARMD分为干性和湿性ARMD。干性ARMD的特征性表现为玻璃膜疣(drusen)的出现,一种由蛋白质和脂质组成的白色或淡黄色物质。干性ARMD由于地图样萎缩损害感光细胞的功能从而导致视力丧失。在湿性ARMD中,视网膜色素上皮(retinal pigment epithelium, RPE)细胞诱导血管生成因子的合成,刺激脉络膜新生血管(choroidal neovascularization, CNV)的形成。这些新生血管穿透Brunch膜-RPE复合体,导致感光细胞死亡,某些情况下可出现视网膜下大面积出血,从而造成严重的视力丧失[4-6]。许多视网膜病变可通过眼科专业检查早期发现。因此,早期诊断和治疗有利于防止视力丧失。然而,眼科检查资源的缺乏大大降低了视网膜疾病早期发现的可能性,尤其是在欠发达的国家和地区[7-8]。眼底疾病研究的最大阻碍就是很多疾病的发病原因不明确,病例特征不清楚,因为研究者难以在活体获得疾病不同发展时期的病理切片。虽然眼底照相、血管造影等影像技术能在一定程度上帮助研究者了解眼底疾病可能的病理改变,但在光学相干断层扫描(optical coherence tomography, OCT)出现之前,没有一项眼科检查技术能够观察到视网膜的内部结构。
OCT是20世纪90年代初发展起来的新的影像学检查方法,90年代中应用于眼科临床。OCT的工作原理类似超声波,但其用光波代替声波。OCT利用低相干光对生物组织进行横截面扫描,并将所获取的信息转化为数字,经计算机处理,再以图形或数字形式显示,清楚地显示视网膜各层的病理改变,提供量化诊断指标。由于OCT是非接触性、非创伤性检测工具,可以多次重复检查而不会给患者带来痛苦,且OCT所具有的高分辨率(<10μm)、实时、能在活体上动态观察疾病的发展过程,因此得以广泛应用于临床,为眼底疾病及青光眼的临床诊断、鉴别诊断、疗效观察及一些疾病的发病机制等提供了客观依据和精确的定量测量数字[9-10]。ARMD病变首先累及黄斑区视网膜色素上皮、Brunch膜及脉络膜毛细血管,在OCT图像上可表现为玻璃膜疣、视网膜外层结构萎缩、CNV、息肉样病灶以及色素上皮脱离(pigment epithelial detachment, PED)。
近年来,随着计算机处理速度的提高,人工智能(artificial intelligence, AI)被广泛地应用于医学疾病的辅助诊断和管理,特别是在眼科领域。AI在眼科的应用目前主要集中在DR、ARMD等发病率较高的疾病上[11]。目前一些研究表明,AI对DR的筛查具有较高的准确性、敏感性和特异性[12-14]。在以往的研究中,我们发现基于AI的眼底照相筛查系统对糖尿病视网膜病变识别的敏感度、特异度及AUC分别达到90.79%、98.5%和0.946[15]。AI技术凭借其阅片速度快、对病变识别准确性高的优点,可能成为解决现有的眼底筛查巨大需求与医疗资源缺乏和分布不均矛盾的途径。目前AI技术对于眼底疾病的筛查更多地应用于眼底彩色照片,而关于基于AI的OCT影像筛查眼底疾病的准确性的报道很少。因此,我们对2019-11/2021-11上海市静安区市北医院门诊患者的OCT图像进行了回顾性研究,比较了眼科医生及AI的读片结果,探讨OCT的AI读片结果的准确性及对ARMD筛查的可行性。
1对象和方法
1.1对象收集2019-11/2021-11上海市静安区市北医院门诊患者1661眼的OCT图像共计1661张,排除因屈光介质混浊、图像捕捉期间固定失败、严重的伪影以及其他原因造成的不清晰图像,对眼底图像清晰可辨的1579张图像进行了分析。本研究仅对眼底OCT图像结果进行分析,不涉及个人隐私信息。本研究经上海市静安区市北医院伦理委员会批准(No.YL-20180503-01)。
1.2方法
1.2.1OCT图像采集本研究的所有图像均由全自动人工智能OCT BV1000采集[16]。所有图像均为6mm×6mm,每秒捕获50000个轴向扫描,产生20μm横向和6μm轴向的分辨率,每眼得到100张连续的OCT图像。
1.2.2读片与识别ARMD在OCT上可有以下特征性改变,根据这些特征由眼科医生及AI作出初步诊断,判断是否可能为ARMD。(1)玻璃膜疣:硬性玻璃膜疣为多个小的色素上皮隆起,反射增强。软性玻璃膜疣为多个大小不等、驼峰状的色素上皮隆起(小的PED),较大的为融合病灶,脱离的色素上皮下方可见中等反射信号,并且可见纤细的连续的Bruch膜。(2)萎缩病灶:视网膜外层结构萎缩,脉络膜毛细血管、色素上皮、IS/OS、外核层等反射光带部分或全部消失,视网膜变薄。(3)脉络膜新生血管:色素上皮层增厚、隆起、连续性破坏,反射增强。纤维血管性PED。周围组织可以出现视网膜下或色素上皮下出血,视网膜层间或视网膜下积液。(4)息肉样脉络膜血管病变(polypoidal choroidal vasculopathy, PCV):分支状血管网OCT表现为色素上皮层反射带结节状,或有双层征;息肉样病灶表现为色素上皮呈陡峭的穹窿状隆起,顶部比较尖,色素上皮高反射,其下方中等反射,病灶旁边有时可见血液浆液性色素上皮脱离。(5)视网膜血管瘤样增生(retinal angiomatous proliferation, RAP):色素上皮脱离,病灶处色素上皮反射条带中断。
1.2.3眼科医生读片由上海市静安区市北医院眼科医生从每眼的100张OCT图像中找出1~2张黄斑区OCT图像,以此模拟临床工作中技师挑选异常图像的过程。挑选出的图像再由两名眼科医生独立评判。两名眼科医生均为高年资主治医生,长期从事眼底疾病的诊治,擅长眼科影像学检查。两名医生之间为双盲审阅读片,得出结论。当两名医生读片结果不一致时,由一名副高及以上眼底病专家做出最终结论。
1.2.4AI读片所有OCT图像上传至AI读片中心,由软件对每眼的100张OCT图像进行自动分析,识别具有特征的视网膜图像,做出病变的识别结论。AI软件的核心算法采用深度学习的卷积神经网络,在OCT切片图像上对ARMD的相关病灶进行位置检测,并综合检测到的病灶结果,做出是否患有ARMD的判断。
统计学分析:使用SPSS 16.0软件对数据进行统计分析。对于ARMD的识别,开展两名眼科医生之间、人工读片和AI算法之间的一致性检验的Kappa值[17]。Kappa值的意义如下:0.21~0.40,一致性一般;0.41~0.60,一致性中等;0.61~0.80,一致性较高;0.81~1.0,高度一致[18]。以眼科医生读片结果为参考,计算AI对于ARMD识别的灵敏度、特异度以及曲线下区域面积(area under curve, AUC)。
2结果
2.1两名眼科医生读片结果一致性分析以无ARMD和有ARMD二分类,对两名眼科医生的读片结果进行一致性分析。结果显示无ARMD和有ARMD的Kappa值在两名眼科医生之间为0.934(表1)。两名眼科医生的读片结果高度一致,可将眼科医生读片结果作为参考,判断AI读片对ARMD的筛查情况。
表1 两名眼科医生读片结果一致性分析
2.2AI与眼科医生读片结果一致性分析以是否患有ARMD二分类,对眼科医生和AI的读片结果(图1~4)进行一致性分析(图5)。结果显示是否患有ARMD的Kappa值在两者之间为0.738(表2),AI读片与眼科医生读片结果之间一致性中等。以眼科医生的读片结果为参考,AI对ARMD识别的灵敏度为73.08%,特异度为95.07%,AUC为0.841。
图1 ARMD OCT图像 A:医生读片:多个玻璃膜疣(黑色五角星),下方Bruch膜连续完整(白色箭头);B:AI读片:多个玻璃膜疣(绿色方框)。
图2 湿性ARMD OCT图像 A:医生读片:局部色素上皮水平可见中反射信号隆起病灶(玻璃膜疣,黑色五角星),局部色素上皮连续性破坏,局部隆起呈中等反射(色素上皮脱离,紫色五角星)。局部隆起呈中高反射,Bruch膜连续性破坏(脉络膜新生血管,红色五角星),两侧可见视网膜下积液(白色箭头);B:AI读片:玻璃膜疣(绿色方框)及色素上皮脱离(紫色方框)。
图3 湿性ARMD OCT图像 A:医生读片:局部隆起呈中高反射,Bruch膜连续性破坏(脉络膜新生血管,红色五角星),两侧可见视网膜下积液(白色五角星),病灶上方可见囊样水肿(白色箭头);B:AI读片:脉络膜新生血管(红色方框)、视网膜下积液(黄色方框)及囊样水肿(蓝色方框)。
图4 眼科医生与AI对ARMD识别的比较。
图5 医生读片与AI读片结果比较。
表2 AI与眼科医生对ARMD读片结果一致性分析
3讨论
本研究评估针对ARMD这一眼底疾病,OCT图像AI自动识别结论与眼科医生读片结果的一致性,发现在基层医院使用基于AI的OCT对ARMD进行筛查是可行的。
在传统诊疗过程中,临床医生需要基于患者的临床症状、体征、病史、眼科检查等多个方面对疾病作出诊断。在本研究中,眼科医生并未与受检者进行沟通,无法得知受检者的症状、体征、病史等信息,仅通过眼底OCT图像进行评估,因此,眼科医生的读片结果仅作为参考,不作为临床诊断。相比眼科医师意见作为标准,判断AI读片结果的准确率、特异度、敏感度等值,采用一致性Kappa分析可以更好地反映AI的性能[19]。在我们的研究中,与眼科医师读片结果相比,AI对OCT图像识别存在一定的差别。回顾相关病例的所有OCT图像,我们发现,造成这些差别的原因一方面由于ARMD患者大多为老年人,屈光介质存在不同程度的混浊,从而影响眼科医师及AI的读片结果。另一方面,我们模拟临床工作中技师挑选异常OCT图像的过程,从每个病例的100张OCT图像中选出异常图像后再进行读片,而AI则对所有100张图像进行读片,从而出现眼科医师读片结果为“无ARMD”,而AI读片结果为“有ARMD”的情况。由此我们认为,由AI对ARMD进行筛查,可能较人工读片更容易发现周边处的微小病灶,更早地引起医师及患者的重视。
眼底疾病是不可逆致盲的首位原因,是世界卫生组织防盲心动中的重点。其中,ARMD是工业化国家65岁以上人群发生不可逆转的视力丧失的最常见原因[20]。到2020年,全球约有2亿人患有ARMD,约占所有失明性疾病的9%[21]。更重要的是,ARMD的患病率近年来显著上升[22-25]。ARMD是一种后天获得性黄斑疾病,其特征是由于光感受器-视网膜色素上皮复合体的迟发性神经变性导致的进行性视觉障碍[26]。RPE在衰老过程中会发生各种变化,导致RPE与Bruch膜内胶原区交界面上出现一种细胞外的黄色物质,成为玻璃膜疣。黄斑内出现玻璃膜疣是ARMD的标志[27]。
OCT是无接触、无创成像技术,以较高分辨率快速对眼部结构进行可视化,清晰地提供横轴位成像[28-29]。在OCT图像上,硬性玻璃膜疣为多个小的色素上皮隆起,反射增强。软性玻璃膜疣为多个大小不等、驼峰状的色素上皮隆起,较大的为融合病灶,脱离的色素上皮下方可见中等反射信号,并且可见纤细的连续的Bruch膜。OCT是眼底疾病临床诊疗的权威检查设备,但传统OCT操作步骤复杂,读片依赖高水平专业医生,限制了OCT在基层的普及应用。
近年来,AI的不断发展使其在医疗领域得到广泛的应用。当OCT图像上传至云端由AI进行读片时,仅需5s便可对一个患者一只眼的100张图像完成读片,且不受时间地点的限制,与人工读片相比(约60秒/100张),大大提高了读片的效率,缩短了时间,适用于社区及基层医院对于眼底疾病的大规模筛查。利用先进的眼科AI技术,是解决我国基层医院眼科医疗资源不足的有效途径,既可以为基层医院对眼底疾病的筛查提供便利,又可以缓解二、三级医院的压力,更好地实现分级诊疗。通过对ARMD的早期筛查后早期转诊到上级医院进行充分的规范化治疗,可以有效挽救ARMD患者视力,改变患者的治疗结局。AI在眼科具有巨大的潜力,然而多数的研究仍处于初级阶段,AI的应用仍面临结果可解释性欠缺、数据标准化缺乏及临床适应性不足等诸多挑战[30]。通过对AI读片结果的分析,进一步优化算法,为实现AI从研究到应用的转化提供支持。
综上所述,AI在基于OCT图像的ARMD识别上与眼科医师有较高的一致性,适用于基层医院对ARMD的早期筛查和早期转诊的工作。然而,本研究中也存在一些不足之处,AI对于ARMD的筛查灵敏度偏低,需进一步完善AI算法,提高灵敏度,降低漏诊率。另外,本研究所研究的眼底疾病病种单一,部分病种样本量不足无法进行进一步统计分析。因此,我们将继续增大样本量,并对其余眼底病种进行分析,以期更加全面地评估AI对眼底疾病识别的敏感度和准确率。