APP下载

人工智能在糖尿病视网膜病变领域的研究进展

2022-12-24马晓宇毕燕龙

国际眼科杂志 2022年11期
关键词:超广角灵敏度筛查

马晓宇, 张 力, 毕燕龙, 3

0 引言

糖尿病视网膜病变(diabetic retinopathy, DR)是糖尿病的常见眼部并发症,也是全球中老年人群的几大致盲原因之一[1-3],我国糖尿病人群中的DR患病率为22.4%[4]。在疾病的早期阶段大多无症状,很容易被患者所忽略,需要进行眼科检查才能被发现[1]。眼底照相作为DR常规筛查项目之一,它可以早期发现、定性评估和分析DR,对于保留患者的视功能、提高患者生活质量、降低DR医疗负担具有重要意义[5],但中国DR患者主动筛查率仍不足20%[5-6],这可能与我国糖尿病患者对DR认识不到位、医疗资源分布不均衡有关[7]。

近些年来,人工智能(artificial intelligence,AI)在医学领域绽放光彩[8-9],尤其是在眼科领域,AI被广泛用于DR[10]、年龄相关性黄斑变性[11]、青光眼[12]和白内障[13]等多种眼科疾病的筛查和诊断中。自动化DR筛查系统日渐成熟[14-16],它们均有不俗的筛查性能,其中,IDx-DR系统成为首个被美国食品药品监督管理局(Food and drug administration,FDA)批准的完全自主的DR诊断系统,也是首个医学领域内完全自主的诊断系统[16]。AI的优势在于它可以将眼科医生从繁重的图像筛查工作解放出来,使其更专注于疾病的诊疗,而且多项研究[10, 17-20]也表示,自动化DR筛查系统的筛查性能等同或优于受过训练的人类分级者。因此,研发更精确的自动化DR筛查系统,将有助于解决医疗资源不足的问题,促进防盲工作的全面开展。本综述总结了AI在DR筛查和诊断领域的研究进展,了解这一领域的研究现状和主要问题,并对未来进行展望。

1 基于彩色眼底照相机的自动化DR筛查系统

Abràmoff等[21]在2013年所发表的IDP模型[22]的基础上加入了深度学习算法,组建了新的IDx-DR X2.1模型,并对其进行训练,使用公开的数据集Messidor-2进行外部验证,结果显示其ROC曲线下的面积(area under curve, AUC)值为0.980,灵敏度为96.8%,特异度为87%,该研究的结果表明IDx-DR X2.1模型的性能明显优于在其他方面基本相同但不使用深度学习的IDP模型,深度学习算法有可能提高DR筛查的效率。随后在2018年,该团队在初级医疗保健机构招募了900例患者进行一项试验,结果显示该系统在临床环境中的灵敏度和特异度为87.2%和90.7%,AI系统将专科诊断能力带入了基层医疗机构[16]。基于这些结果,美国FDA授权该系统来检测中重度DR和糖尿病性黄斑水肿(diabetic macular edema,DME),其也成为了第一个进入临床工作的自动化DR诊断系统,此举将有可能防止每年成千上万的糖尿病患者的视力丧失。

随后,Gulshan等[23]以深度神经网络Inception-v3为架构,收集了10万余张眼底彩色图像进行建模,在公开的Messidor-2数据集和EyePACS数据集上进行外部验证,该模型设置了两个不同的参数点,以满足不同的临床需求。在不同的参数设置下,模型在2个外部数据集的灵敏度和特异度均>90%。有研究团队将模型部署在印度的两家眼科保健中心,在真正的临床环境中对其进行性能测试,患者的眼底图像分别由眼底病学专家、经过训练的眼科医生和模型识别,以实际临床结果作为参考标准,模型在两个不同保健中心的数据集上的AUC分别为0.963和0.98,识别可转诊DR和DME的敏感度和特异度在88.9%~97.5%之间,而且研究发现模型的性能丝毫不逊色于眼底病专家和受过训练的眼科医生,而且两家保健中心所使用的眼底照相机也不同,表明了该模型的普遍适用性[10]。

2017年,Ting等[24]开发了一个深度学习系统(deep learning system,DLS),并且使用近50万张来自不同国家和种族的眼底图像来训练和验证系统,这是已知的数据集规模最大的一次实验。DLS在验证集的检测准确性,即AUC值为0.936,灵敏度为90.5%,特异度为91.6%。同时检测另外10个不同种族、不同相机类型的数据集时,其AUC值范围是0.889~0.983。在2019年,该团队还比较了DLS与人类评估员的筛查与诊断性能,还估计了两者所需的时间,DLS和人类评估员花费的总时间分别为125.4和1554.8h,在DR筛查性能方面,DLS和人工并无差异[20]。

国外对于AI在DR筛查与诊断领域的研究如火如荼,国内的研究也在进行。2019年,李萌等[25]通过迁移学习和NASNet架构算法,以4 465张DR彩色眼底照片作为数据集,建立一个自动化DR诊断系统(ZOC-DR-V1),该系统的灵敏度和特异度分别为96.89%和93.57%,AUC值为0.994,同时作者也进行了一个人机竞赛,另取1 000张眼底照片作为人机对抗用图,比较AI阅片系统与人工阅片的诊断效率,结果表明AI系统的诊断正确率可达眼科专业高级职称医生水平,而且相比于眼科专业高级职称医生5s左右的单张阅片时间,AI系统仅需2s左右即可完成单张阅片,用时短,效率高,为大规模DR人群筛查提供了新的思路。2020年,李治玺等[26]使用自研的AI系统作为DR的初筛手段,在新疆维吾尔自治区进行大规模DR筛查,在不遗漏可转诊DR病例的情况下,减少约60%的图片分级工作量,且相较于人工出结果的时间1.3d,AI系统仅需19.2min即可完成从图像上传到报告完成。

2 基于智能手机眼底成像的自动化DR筛查系统

除了使用常规眼底成像设备来拍摄眼底照片,还出现了一种便携式设备——基于智能手机的眼底成像设备,体积小、价格低、成像清晰、对于偏远地区和基层医院来说,是性价比较高的一款眼底成像设备。2018年印度推出智能手机眼底检查(fundus on Phone,FOP)[27],它的重量仅有传统成像设备的二十分之一,无需放大瞳孔即可成像。同年,印度Rajalakshmi等[27]将此设备与EyeArt系统相结合,测试该设备在检测DR方面的作用,是首个将AI和基于智能手机的眼底成像设备结合的实验。该算法检测DR的灵敏度和特异度分别为95.8%和80.2%。其他同样使用该眼底相机的研究团队[28-30]也得到了相似的结果。巴西Phelcom Technologies公司的Eyer同样也是一台基于智能手机的眼底成像设备,Malerbi等[31]将其与AI算法结合,结果显示超过80%的患者图像质量良好,同时,算法的灵敏度和特异度为97.8%和 61.4%,AUC值是0.89。基于智能手机的眼底成像设备对于初级医疗保健机构来说,是很好的消息,市面上的眼底成像设备价格高昂,体积大,也无法随身携带,便携式设备的问世以及其与AI的结合将会开启社区及偏远地区DR初步筛查的新阶段。

3 基于超广角照相机的自动化DR筛查系统

上述的研究所采用的图像都是以黄斑为中心或视乳头为中心的45度范围的眼底照片,可观察的区域较小,DR并不仅是只发生于中心视网膜,其在周边视网膜也会出现。近些年来,超广角眼底成像开始在自动化DR筛查领域崭露头角[32-35]。2017年,Wang等[34]探讨了EyeArt系统在检测欧堡超广角眼底图像中可转诊DR的灵敏度和特异度,实验结果显示灵敏度较高,特异度为中等,考虑原因是:(1)EyeArt系统还未针对超广角图像进行参数优化;(2)视网膜周边出现的与DR无关的改变也可能会潜在地对算法造成混淆,因为后来对假阳性照片进行回顾,发现病灶多表现为色素改变。2019年Nagasawa等[35]开展了一项类似的研究,检测深度学习算法评估超广角眼底图像中的增殖性DR的准确性,他们利用采集到的超广角眼底图像对算法进行9折交叉验证,最终结果显示灵敏度为94.7%,特异度为97.2%,AUC值为0.969。超广角眼底成像技术与AI的结合将会成为未来的一个趋势,因为视网膜周围部的图像在预测DR进展方面起着关键的作用[36],任何基于眼底图像的自动化DR诊断/预测工具都应该考虑检查中央和周边视网膜,而不是仅局限于使用以黄斑或视乳头为中心的彩色眼底照片,所以未来需要更大的超广角眼底图像数据集去训练和验证AI系统。

4 问题与展望

彩色眼底照相机是常用的眼底成像设备,适用于眼科专科门诊;基于智能手机的眼底成像设备小巧便携,适用于社区医院等初级医疗保健机构;超广角照相机可以发现周边视网膜病变;无论是哪种成像设备,AI都展现了其不俗的识别性能,以此适应不同的临床环境。作为研究最成熟的彩色眼底照相机,目前已有相关产品进入临床使用阶段,比如IDx-DR[16],其可以直接给出是否需要就诊的建议,因此非眼科医生也可以使用该设备,但其也并非万能的,比如曾有过眼底手术史、妊娠糖尿病等患者不建议使用该设备进行筛查[37]。中国也于2020年批准了来自深圳和上海的两款DR辅助诊断软件产品注册[38],这两款产品的定位是辅助诊断,为临床医生提供参考,无法独立给出建议。AI产品已在慢慢走向临床,但距离将其全面运用到临床中,还有很长的路要走。目前还存在一些挑战:(1)数据集中的图像的单一性。目前用于训练和验证的数据集中的图像仅涉及正常人和DR患者,而在真正的临床环境中,患者的眼底是很复杂的,可能存在除DR之外的多种病变,AI目前尚无法准确区分这些病变;(2)建模的准确性依赖数据集的质量与数量。一家医院所能提供的DR图片量少,且因为涉及到患者隐私和伦理问题,医院之间无法共享医疗数据,由此出现“数据孤岛”现象,数据集小,训练效果不如意。2016年,一种新式机器学习方法—联邦学习的出现将有助于解决这一困境[39],它最大的特点是能够帮助多个用户在满足隐私保护、数据安全和政策法规的情况下,利用无法共享的数据进行学习和建模,由参数共享取代数据共享,这对打破数据安全壁垒具有很好的作用,在未来有可能解决数据孤岛这一问题;(3)AI系统识别能力有限。对于质量较高的图片,AI系统能很好地识别,但在一些非常规情况下,比如照片模糊、对比度差、角度扭曲等,在这些情况中,AI系统还不能显现出较优的辨识能力;(4)神经网络的黑箱性[40]。目前的AI筛查系统多基于深度神经网络构建,而神经网络是一种模拟人的大脑进行思考计算的算法,该算法内部有很多计算层与节点,层与层、节点与节点之间都可能会交叉交换信息,这样的计算复杂度使得神经网络在解决某些大数据问题时得到超出一般算法的准确度。但是这种规模的计算太复杂,无法通过简单直接的公式进行说明,而医学诊断需要结果准确且具有可解释性,因此,这将成为AI系统应用到临床的一大阻碍;(5)成像设备局限。目前所用的图像还是多以黄斑或视乳头为中心的拍摄范围为45度的图像,但DR不仅局限于中心视网膜,未来应将超广角眼底摄像的图像纳入训练集,训练AI系统对这类图片的识别;(6)患者对AI系统是否接受。之前的研究多集中在AI系统在DR筛查和诊断方面的准确性,鲜有研究去探讨患者是否接受AI为自己看病,澳大利亚的一项研究[18]对此进行过探讨,但其样本量较少,不足百人,后续需要较大的样本量去阐述这一问题。

《中国2型糖尿病防治指南(2020年版)》已经明确提出AI筛查和分级诊断在糖尿病防治中具有巨大的潜力[41],而且近些年来随着AI技术的快速发展,AI系统的功能也在不断扩展,除了能够对DR进行自动分级,使患者了解病变的严重程度,还可以实现病变分割,即识别病灶的特征,同时依据病灶特征进行更准确的分级诊断[42]。AI的出现,有望会改变当前DR诊疗体系,在社区或非眼科门诊部署设备,对糖尿病患者进行普筛,并给出合适的建议,将大大降低DR的致盲率,提高糖尿病患者的生活质量,促进防盲工作的全面开展。

综上所述,作为一种新兴技术,虽然自动化DR筛查系统还存在一些挑战,但其在识别可转诊DR方面已展现出较高的特异度和灵敏度,检测性能也等同于或优于人工,既减轻了医生的工作负担,也提升了诊疗效率。所以,我们应对其充满信心,相信在未来通过完善算法和眼底成像设备,AI将可以走进临床协助眼科医生做出诊断。

猜你喜欢

超广角灵敏度筛查
点赞将“抑郁症筛查”纳入学生体检
超广角扫描激光检眼镜的特点及其在眼科学中的临床应用
《图说超广角荧光素眼底血管造影》出版发行
预防宫颈癌,筛查怎么做
OCT 联合超广角眼底照相在视网膜色素变性早期诊断的临床应用
NRS2002和MNA-SF在COPD合并营养不良筛查中的应用价值比较
超广角非球面手机镜头设计
智力筛查,靠不靠谱?
导磁环对LVDT线性度和灵敏度的影响
地下水非稳定流的灵敏度分析