人工智能在近视防控中的初步应用△
2022-12-07刘雨佳瞿小妹
刘雨佳 瞿小妹
[1.复旦大学附属眼耳鼻喉科医院眼科 上海 200031;2.国家卫健委近视眼重点实验室(复旦大学) 上海 200031;3.上海市眼视光学研究中心 上海 200031]
近视是视觉障碍的主要原因之一[1],其患病率逐年攀升[2],极大地加重了社会经济负担[3]。王宁利等[4]提出了近视防控的三级预防措施:预防近视发生、控制近视加重、防止发展为病理性近视。近视防控工作高度依赖操作人员和检查设备,而欠发达地区的医疗资源和人民健康意识相对薄弱,初级眼保健服务体系尚未成熟[5],亟待投入可靠的新技术以降低成本,实现可持续性。
人工智能(artificial intelligence,AI)是一种赋予计算机类似人类的思维和行为方式的计算机科学。近年来,AI 技术发展迅速,已广泛应用于医学领域,如糖尿病性视网膜病变的筛查[6],且准确度和稳定性较好[7]。AI 在近视防控领域也逐渐崭露头角。本文对人工智能在近视防控中的应用研究进行综述。
1 人工智能概述
人工智能的概念在1956 年的达特茅斯会议上被首次提出。1963 年,西洋跳棋程序战胜了美国的人类跳棋大师。但AI 技术在进一步研究中遇到了许多实际问题,其发展一度停滞。20 世纪80 年代初,专家系统兴起,大大提高了产业效益,但其通用性较差且维修成本高昂,AI 的发展又一次受到阻碍。1997 年,“深蓝”机器人击败世界象棋冠军,AI 的发展重被提上日程。经历了三起两落,随着算力的增加和大数据储存的实现,AI 正处于第三次浪潮中[8]。
机器学习(machine learning,ML)是基于某一给定的算法或网络架构,给予计算机一定数量的数据样本进行认知学习,从而对新的同质样本实现自动化识别分类和预测,但其中间过程并不明确。与传统统计学方法(如相关性分析、线性回归模型)相比,机器学习不仅能够分析和总结复杂的非线性数据,还能分析潜在的变量、提供数据预测模型[9]。
深度学习(deep learning,DL)是机器学习的分支和发展。深度学习的基础是人工神经网络(artificial neural network,ANN)。DL 神经网络既是分类器,也是特征提取器,可以实现端到端的学习,即输入大量的原始数据,无需人工编码便可直接输出类别。卷积神经网络(convolutional neural network,CNN)被认为是最适合进行图像识别的深层神经网络结构,已广泛应用于与图像相关的诊断和预测。DL 的质量受到训练集的大小影响[10]。
此外,目前较热门的随机森林(random forest,RF)、支持向量机(support vector machine,SVM)、极端梯度提升(extreme gradient boosting,XGBoost)、多元自适应回归样条(multivariate adaptive regression splines,MARS)等也属于ML的范畴[8]。
在近视防控领域,屈光数据等大数据样本以及眼科本身高度依赖图像的特点,使AI 在预测近视发生、近视进展及预警高度近视及病理性近视方面具有极大潜力。
2 人工智能在近视防控领域的应用研究
2.1 人工智能在预测近视发生中的应用 近视筛查是近视防控的第一道关口。近视筛查工作的开展受到专业人员数量和设备条件的限制,普及性较差。AI 有望为大规模近视筛查提供新的出路。
Yang等[11]研发出通过眼表照片筛查青少年是否近视的DL 模型,受试者工作特征曲线(receiver operating characteristic curve,ROC 曲线)下面积(area under the curve,AUC)达80%以上,实现了对青少年屈光状态的远程监测。Ma等[12]基于DL 开发了一款在暗室中使用智能手机自动测量瞳距、屈光度范围等数据的应用程序,结合其他个人信息,可推算儿童斜视、近视和屈光参差的风险。黄峻嘉等[13]选取了RF、自适应提升(AdaBoost)、装袋(bagging)、梯度提升(gradient boosting)和XGBoost 5 种算法分析儿童、青少年屈光数据,通过同一对象2 个时间点的检查数据训练模型,预测后一时间点是否近视。其中RF 模型表现最佳,预测准确度可达92.8%。
2.2 人工智能在预测近视进展中的应用 对处于近视进展期的患儿,现有检查手段只能了解其现阶段的屈光状况,无法准确判断近视的中远期发展趋势。因此,往往需要密集的定期随访,以监测近视度数和相关眼部光学参数的变化。探寻眼部生物学特征与近视度数的相关性,可以简化近视监测的流程,深化眼科医师对近视发展的认识,揭示近视潜在的发生、发展机制。
2.2.1 对未来时间点近视度数的预测 Lin等[14]汇总了8 家眼科中心电子病历中的学龄期儿童屈光数据,利用年龄、等效球镜度数(spherical equivalent refraction,SER)和过去的年进展率训练RF 模型,预测10 年内的近视度数变化和高度近视风险,为近视的精准干预提供了可能性。Chen等[15]比较不同类型的ML 模型预测随访队列1 年后和7 年后近视发展的表现,发现RF 模型不适合预测儿童近视发展,而SVM 或MARS 表现出较高的可靠性和准确性。这一研究提示,算法模型的选择仍需更深入的研究。
2.2.2 基于眼部生物学特征对近视度数的预测 眼轴(axial length,AL)是监测近视发展的重要指标,但其与屈光度变化的定量关系尚不明确。唐涛等[16]收集了1 011 例青少年的眼部光学参数和社会学信息,采用立方SVM 等6种ML 模型处理多模态数据,使用5折交叉验证法训练和测试模型,预测不同年龄跨度近视人群眼轴增长1 mm 所对应的SER 变化量。结果发现SVM 表现最佳,其AUC 达0.98,准确率为93%。
已有研究尝试通过眼底照片、光学相干层析成像(optical coherence tomography,OCT)等图像预测屈光度数。Varadarajan等[17]率先尝试训练了一种基于眼底照片预测屈光度数的DL 模型,在使用的2 个数据集中SER 预测结果的平均绝对误差(mean absolute error,MAE)分别为0.65 D 和0.91 D。石征锦等[18]利用数字图像处理技术以及DL 中的稠密连接卷积网络(densely connected convolutional networks,DenseNet)模型自动提取广角激光眼底图像中的近视性眼底改变特征,进行回归预测,得出屈光度的预测值。Yoo等[19]开发并验证了基于后段OCT 图像的DL 模型以预测SER 及检测高度近视,并使用梯度类加权激活映射(gradient-weighted class activation mapping,Grad-CAM)技术实现特征可视化。该模型预测SER 的MAE 为2.66 D,检测高度近视的AUC为0.813,准确率为71.4%。Li等[20]开发了基于眼底照片自动识别和分割视盘旁萎缩(parapapillary atrophy,PPA)的算法,并与眼科医师的标注进行比较,准确率达90.78%,还观察到了PPA 与近视进展之间的强关联。
使用波前像差数据预测主觉屈光度数也已产生一些成果。Rampat等[21]使用基于新型多项式分解的波前像差数据训练XGBoost 模型,预测转换为向量(M,J0,J45)的主觉验光结果,其MAE 在0.094~0.301 D 之间。Leube等[22]基于37 个维度(36 个Zernike 系数+瞳孔直径)的特征向量训练DL 网络,能够可靠地预测主觉屈光度向量。
2.3 人工智能在预警病理性近视中的应用 病理性近视是视力损害的主要原因,患者伴有典型的眼底并发症。目前尚不清楚病理性近视是否与近视本身并行进展,其机制也尚未明了。对近视人群开展病理性近视的早期预警,在预防低视力和防盲工作中具有重大意义[23]。
脉络膜厚度(choroidal thickness,ChT)是预测高度近视和病理性近视的重要指标[24]。Sun等[25]通过视盘及周围区域早期变化的成像信息,构建了与ChT 显著相关的ML 定量模型,探索将其作为年轻近视患者ChT 的早期指标。
现已有较多基于眼底照片预测病理性近视的研究。Wan等[26]提出了一种基于深度卷积神经网络(deep convolutional neural network,DCNN)的辅助诊断算法,可将眼底图像自动分为正常眼底、低危高度近视、高危高度近视三类,其表现优于眼科医师,低危高度近视AUC 为0.996 8,高危高度近视AUC 为0.996 4。Rauf等[27]使用CNN 模型识别眼底照片是否为病理性近视,AUC 为0.984 5。Kim等[28]使用眼底照片的中央凹、视盘和眼最深点(deepest point of the eye,DPE)作为关键指标来量化后巩膜断层提升(tomographic elevation of the posterior sclera,TEPS),建立SVM模型预测病理性近视。Hemelings等[29]基于眼底照片使用CNN 检测病理性近视并进行相关病变分割,AUC 达0.9867。
OCT 图像也被用作算法的训练数据集。Sogawa等[30]基于扫描源光学相干层析成像(swept-source OCT,SS-OCT)图像建立DL 模型识别有无近视性黄斑病变(myopic macular degeneration,MMD)。Li等[31]基于黄斑OCT 图像训练4 个独立的CNN 模型,以识别视网膜裂孔、黄斑裂孔、视网膜脱离和病理性近视脉络膜新生血管形成(pathological myopia choroidal neovascularization,PMCNV)4 种威胁视力的疾病,AUC 达0.961~0.999,灵敏度略优于视网膜专家,且具有高特异性。此外,该模型允许精确可视化病变位置和显著特征,可为眼科医师提供热图以促进目标诊断。Tan等[32]开发了基于眼底照片的DL 算法检测MMD,使用新加坡的数据集完成训练和内部验证,使用来自中国、印度、俄罗斯和英国的数据集进行外部测试,将其结果与6 位眼科专家的分级进行了比较,并展示了其安全性和实际应用效果,有望成为全球大规模MMD 筛查和病理性近视风险分层的有效工具。
2.4 人工智能在近视控制手段中的应用 对于被识别为高风险的儿童青少年,应及时给予个性化近视控制方案。现已被证实有效的控制手段有低浓度阿托品滴眼液、角膜塑形镜和周边离焦框架眼镜等[33]。
Wu等[34]使用5 种ML 模型评估使用阿托品时可能影响眼压(intraocular pressure,IOP)的19 个重要因素,结果显示XGBoost 是最佳预测模型,基准IOP 是最准确的预测因子。Fan等[35]构建了基于角膜前表面高地图的ML 模型,以预测不同年龄、性别和眼部参数组合的反转弧深度(return zone depth,RZD)和着陆角(landing zone angle,LZA)值,可行性和有效性较好。Fan 的团队[36]又构建了用于估计角膜塑形镜验配中定位弧(alignment curve,AC)曲率的ML 模型,以期最大限度地减少试镜次数,降低试戴引起交叉感染的可能性,结果显示线性SVM 学习模型性能较优。
3 展望
屈光数据及眼部生物学资料中蕴含近视发生、进展及其相关病变的潜在信息,机器学习可以通过创建特征从现有的变量中推导出新的变量,揭示数据集的隐含关系,并能填补数据的缺失项。通过选择特征、调试参数、比较运用多种模型及交叉验证数据集,可以提高预测模型的准确性,获得更可靠的性能。深度学习,尤其是CNN,在病理性近视诊断和眼底病变识别方面表现优异。
上述研究虽然展现出了良好的性能,但仍有一些潜在的问题。其一,多数算法模型是基于单一种族小样本数据集的训练,在真实临床环境里更具异质性的数据集中,算法准确性可能会降低。其二,现有模型多为单模态学习模式,基于单一信息建立,缺乏社会学信息、家族遗传史等。其三,现阶段AI 模型多为“黑箱式推理”,而医学决策要求具备可解释性[37]。若能提供可解释的依据,如通过DL 辅助诊断中的遮挡实验、软注意力提取等方法生成热图将增加算法的可信度,提高专业医师和大众对AI 辅助医疗的接受度[38]。此外,过程透明化也有望提示潜在的重要指标,揭示近视进展的内在机制。其四,预测模型从“是否”“有无”的定性预测走向精确的定量预测、病变亚型的精准分类,还面临着诸多算法网络结构和逻辑方面的难题,有赖于AI 技术的进一步发展。
对于未来人工智能在近视防控领域的应用,应制定标准化流程,建立开放的专业数据集,提升数据量级,建议研究者使用多种算法模型并进行比较评估,选择出性能最优的模型进行临床转化。鼓励大规模前瞻性的临床资料采集,加强全球合作,纳入不同地区不同种族的异质性数据,强化模型的验证步骤(内部验证与外部验证相结合,预测结果与人类专家的结论相比较),提高模型的适用性和可靠性。数据安全性问题也值得关注,研究者应注意加强隐私保护和信息管理。目前,AI 在探索近视防控措施的疗效方面应用较少,如预测患者接受治疗后的近视进展情况。疗效的预测需要以儿童、青少年本身动态变化的屈光状态为基础,但目前不同治疗模式的效果和适用范围仍尚未明了,实现准确预测难度较大,AI 在该领域应大有可为。
人工智能技术已成为近视防控及管理的潜在辅助手段。AI 可以助力近视的早期识别、持续监测,实现风险分层、定位高危个体,开展以患者为中心的个体化精准治疗。AI 的参与大大提高了筛查和监测流程的自动化程度,且兼具精确度,可以降低对操作者的依赖性,实现对基层和医疗欠发达地区的远程监控,节省大量人力物力,拥有更优的可持续性,有望补充现有医疗保健体系的不足,实现近视的三级预防。