基于多光谱眼底成像开发的人工智能对糖尿病视网膜病早期体征的识别
2022-02-22马菲妍张彩霞冬雪川
马菲妍,张彩霞,冬雪川
(1.河北医科大学第二医院, 河北 石家庄 050005;2.深圳市新产业眼科新技术有限公司,广东 深圳 518055)
糖尿病视网膜病变(DR)是糖尿病患者常见的眼部并发症,在中国总人口中DR的患病率为1.14%,在糖尿病患者人群中患病率为18.45%[1],DR能造成视力不可逆的损伤,是工作年龄人群丧失视力的主要原因。而DR的早期预防、定期检查、早期诊断并及时给予有效治疗对延缓病变进展、减少视力丧失至关重要。多光谱成像技术是一种新型的眼底成像技术[2],它可以利用各种波长不同的单色LED光源,分别投射入眼底不同深度[3],采集基于不同组织及病理产物吸收光谱的差异形成的图像,可以更清晰地观察包括糖尿病视网膜病变在内的各类疾病体征。人工智能(AI)尤其是深度学习算法近年在医疗健康、自动驾驶、游戏竞技、网络安全等领域展现了巨大的潜力,并开始应用在实际场景[4-11],尤其是在糖尿病视网膜病的自动检测中体现了一定的价值[12-15]。但深度学习通常需要大量人工标注的样本数据,给软件的开发带来相当的困难。多光谱眼底图像通过多种光谱,多种通道和维度展现疾病的特征,有望降低样本量要求,节约开发资源,并进一步提升智能诊断的敏感性和特异性。本研究中笔者通过对比基于多光谱眼底成像开发的AI系统和传统医师对糖尿病视网膜病变的诊断一致性,以评估AI的实际诊断能力。
1 资料与方法
1.1一般资料:收集自2018年4月~2018年10月期间于河北医科大学第二医院眼科门诊就诊的200例糖尿病患者的右眼多光谱系列图像(RHA2020多光谱眼底成像系统,ANNIDIS corporation,加拿大),波长范围包括550 nm、580 nm、590 nm、620 nm、660 nm、690 nm、740 nm、760 nm、780 nm、810 nm、850 nm,全部图像均在免散瞳条件下拍摄,以黄斑中心凹为中心,成像范围43°,见图1。本研究符合赫尔辛基宣言,并由河北医科大学第二医院伦理委员会审核通过。
图1 多光谱眼底成像所获得的各波长图片以及拟合而成的功能图
纳入标准:年龄≥18岁;已经过详细的内分泌检查确诊为2型糖尿病;无角膜瘢痕、晶状体混浊等影响眼底拍摄的屈光介质异常;图像对焦清晰,无异常伪影;亮度均匀,可明显分辨血管和视盘等主要眼部结构。排除标准:图像明显分辨率不足或其他图像拍摄异常;病历资料不完整。
1.2方法
1.2.1阅片者分组:依据阅片方式的不同将阅片者分为四组:①采用AI系统阅片定义为AI组;②由3名具有5年以上眼底照片和眼底检查经验的眼科医师组成的高年资眼科医师组;③由3名具有5年以下眼底照片和眼底检查经验的眼科医师组成的低年资眼科医师组;④由3名无既往眼科检查经验,在本研究开始前经过系统阅片培训的内分泌医生组成的内分泌医师组。
1.2.2多光谱眼底图像的标注:均采用分级标注,共四级:①无微血管瘤或出血点;②1个象限存在微血管瘤或出血点;③1~3个象限存在微血管瘤或出血点;④4个象限均可见微血管瘤。底图像均由2位资深眼底专家独立诊断并意见一致时为确定诊断,意见不一致时交由第3名眼底专家阅片,定标一致的结果作为阅片标注的参考标准。
1.2.3阅片的方法:AI组和全部医师组均对所有眼底图像进行阅片。AI组由研究人员将图像输入软件系统进行阅片,并保留自动诊断的结果;医师组均通过RHA自带的电脑系统和阅片软件对多光谱眼底图像进行阅片,保留阅片结果。同时记录AI和医师组单张阅片时间和总耗时。
1.3统计学方法:采用SPSSAU20.0进行统计学软件处理数据。不同阅片者的阅片结果和参考标准的比较采用加权Kappa系数进行评价,AI组和医师组的比较以Kendall系数进行评价。AI系统和各医师组的单张平均阅片时间比较采用重复测量方差Bonferroni法分析,根据球形度检验结果选择Greenhouse-Geisser校正结果,以P<0.05为差异有统计学意义。
2 结果
2.1阅片结果的一致性比较:高年资眼科医师组、低年资眼科医师组、内分泌医师组共9位医师的阅片结果与参考标准相比较的加权Kappa系数见表1。各组间相比,AI组和高年资眼科医师组的Kendall协调系数为0.957,差异有统计学意义(P<0.01),诊断水平接近;AI组与低年资眼科医师组和内分泌医师组相比,差异有统计学意义(P<0.01),内分泌医师组和低年资眼科医师组协调系数依次低于AI组和高年资眼科医师组,但差异无显著统计学意义(P>0.05)。见表2。
表1 不同阅片者对多光谱DR眼底图像标注一致性的比较
2.2阅片速度的比较:AI组、高年资眼科医师组、低年资眼科医师组、内分泌医师组的平均阅片时间分别为(1.48±0.27)s,(14.92±3.26)s,(15.56±3.24)s,(40.13±6.59)s。见图2。各组平均阅片时间的差异具有统计学意义(F=3220.879,P<0.01)。各组间比较,AI组的阅片时间明显少于各医师组,高年资眼科医师组和低年资眼科医师组少于内分泌医师组,而高年资眼科医师组和低年资眼科医师组之间差异无统计学意义(P>0.05)。见表3。
表2 不同阅片组对多光谱DR眼底图像标注一致性的比较(n=200)
图2 人工智能系统及不同级别医师单张平均阅片时间的比较
表3 不同阅片组对多光谱DR眼底图像标注时间的比较
3 讨论
DR根据组织病理学和严重程度主要分为非增生性糖尿病视网膜病变(NPDR)和增生性糖尿病视网膜病变(PDR),NPDR最早期可识别的眼底表现则是视网膜微血管瘤[16]。微血管瘤的出现通常不会引发明显的临床症状,但微血管瘤的存在代表已存在组织结构损伤。在流行病学研究和临床试验中发现,微血管瘤数会随着DR的发展而增加,可预测从NPDR转变为PDR和黄斑水肿的进展[17-20]。微血管瘤的存在和严重性已经被可靠的用于评估DR的严重性和进展风险。
传统眼底照相和眼底镜采用可见光波进行眼底观察,由于可见光拍摄过程中不同光谱信息存在干扰,微血管瘤的信噪比明显降低,容易造成微小病灶的遗漏,不利于对疾病的观察,容易忽视早期糖尿病视网膜病变。
荧光素眼底血管造影比眼底照片可更早和更多地发现微动脉瘤,明确区分动脉瘤与出血点[21-23]。但因其为有创检查,且检查时需要应用造影剂,可能会对有严重肾功能损伤的患者造成负担,并存在引起严重过敏性休克反应的风险,所以一般在糖尿病视网膜病变的筛查阶段并不被采用。
多光谱成像技术是一种新型的眼底成像技术,利用波长不同的单色LED光源,分别投射入眼底不同深度,采集基于不同组织及病理产物吸收光谱的差异形成的图像,可以清晰地将视网膜、脉络膜分层显示在不同的照片上,以冠状面图像方式呈现。对疾病代谢物质可用敏感波长进行重点观察,因此能灵敏地发现疾病异常。该检查快速便捷且无创,无需散瞳,可适用于早期筛查多种眼底疾病[24-28]。
Li等[29]以FFA作为参照标准,将常规眼底照相和多光谱成像对比,认为在DR的早期筛查中多光谱成像对于微动脉瘤的检测要比常规眼底照相更为敏感、可信,且形态上与FFA保持高度的吻合,尤其在580 nm波长的图像。而Kerry等[30]则发现多光谱相对眼底彩照,甚至能够探及糖尿病前期的微血管瘤。此外也有其他众多的研究证明了多光谱成像在DR疾病诊断领域的价值[31-32],因此对于DR的早期筛查,MSI相比传统彩照有更明显的优势。但多光谱也有其局限性,包括图像张数多,阅片时间长,学习曲线长等。
AI 是计算机科学、控制论、信息论、神经生理学、心理学、语言学等多种学科互相渗透而发展起来的一门综合性学科,其通过制造智能机器或智能系统,模拟或延伸人类智能活动能力。深度学习算法具有自动特征提取功能,可基于有标注的样本自行学习并抓取图片中的特征,最后输出自行分类的结果。保证深度学习准确度高的前提之一,是样本在人工标注阶段被尽可能正确地标注分类。高质量的大样本标注可使深度学习算法自动特征提取的优势得到充分发挥,对病变识别与分类的准确度更高,与人工标注一致性更好。但在临床和实际人工智能的开发中,大样本的获取往往有现实上的困难。多光谱人工智能采用多光谱、多通道进行开发,针对敏感体征的波长所呈现的对比度更容易被AI所提取,因此在准确性和样本量的节约方面有着明显的优势。
本研究对比了多光谱人工智能阅片系统和医师阅片的准确性及一致性。人工智能展现了和高年资眼科医师基本等同的阅片能力,甚至略高于低年资眼科医师和内分泌医师。由于本研究主要比对不同阅片组对微血管瘤/出血点的识别力,而本体征识别难度低,相对常见,易于医师学习和掌握,因此低年资眼科医师组和内分泌医师组的准确性虽略低于AI和高年资眼科医师组,但差异无统计学意义(P>0.05)。但AI 阅片克服了不同医师的知识构成不同、标注时的心理状态与精力存在差异以及随着时间推移带来的记忆力和理解力的改变等主观差异的影响,显然更适合疾病筛查场景[33]。
本研究同时比较了AI和各阅片医师组的阅片时长,AI总体领先于医师组,这是由计算机的运算特征所决定的,与AI 系统的运行速度,计算机硬件配置、处理系统、 AI 算法的复杂程度及图形处理器的部署等因素有关。研究中,高年资眼科医师和低年资眼科医师的阅片时间接近,是因为本体征的识别是眼科医生的基本诊断工作,在难度上基本没有明显的差异。但内分泌组医师的阅片时间明显延长,这是因为其对眼专科疾病的相关知识了解较浅,缺乏对眼底病变诊断的经验,且对病变的病理基础认识不足而不能适应阅片工作,结合其在诊断准确性上的不足,本类AI的开发可能更适合全科医生的使用。
本研究的局限性在于未考虑多种多光谱成像系统采集图像识别的通用和兼容性能,同时也仅对微血管瘤/出血点单一体征进行识别,而AI软件尚需要进一步完善。未来,需要在此方向进行多中心和多层级的临床研究验证。
综上所述,糖尿病视网膜病的疾病诊断对于全科医师和年轻医师阅片标注的难度大,学习曲线长。通过人工智能和多光谱眼底成像技术的结合能够提升阅片质量和阅片速度,降低开发难度,有利于不同资质的医师,尤其是全科医师和年轻医师快速掌握本病的诊断和筛查。