基于卷积神经网络的睑板腺形态人工智能分析系统的构建
2021-10-13朱敏颖林晓蕾张祖辉戴琦
朱敏颖 林晓蕾 张祖辉 戴琦
睑板腺功能障碍(meibomian gland dysfunction,MGD)是一种慢性、弥漫性睑板腺异常,可引起泪膜异常、眼部刺激症状、炎症反应及眼表损害[1]。目前MGD的病因及发病机制尚不明确,但有研究发现睑板腺形态和功能存在密切关联。Pult等[2]发现睑板腺形态缺失与泪膜脂质层厚度和稳定性密切相关。Yin等[3]研究认为睑板腺形态上不均匀缺失与MGD密切相关。Ban等[4]认为上眼睑睑板腺缺失与睑板腺分泌分数及泪膜脂质层相关。目前Arita等[5]的分级法是使用较多的评价睑板腺形态缺失的指标,但其人工标注工作量大、效率低、误差大。基于深度学习的人工智能(artificial intelligence,AI)系统在分类及图像识别方面的效率和精度都远高于图像处理算法和早期的机器学习算法,且成本大幅降低,是目前医学诊断当中最火热和最具有前景的发展方向。深度学习经过多年的发展,人们提出了许多深度神经网络,其中,卷积神经网络(convolutional neural network,CNN)已被成熟应用于人脸识别、文字识别、图像检索等多个领域[6-7]。对于物体识别、图片分类等,CNN的准确率可以接近甚至优于人工分析方式[8-9]。Wang等[10]和Zhou等[11]使用CNN对睑板腺萎缩进行分级,结果证明AI技术对睑板腺萎缩的自动评价是有效的。但目前研究主要关注整个睑板区域和萎缩区域的识别,并没有对每根睑板腺腺体进行检测和评价。笔者团队前期研究提出睑板腺弯曲度及睑板腺密度两项定量评价指标[12],可以成为AI系统的进阶评价指标。本研究建立的AI系统是基于CNN的U-Net网络构建的,该系统能够自动处理睑板腺图片,识别出睑板腺的单根腺体,并使用前期提出的睑板腺量化评价指标来准确评估睑板腺的各项形态参数。
1 对象和方法
1.1 对象 选取2020年12月至2021年3月在温州医科大学附属眼视光医院杭州院区就诊的60例受试者作为研究对象。其中阻塞性MGD患者32例(MGD组),健康志愿者28例(正常组)。MGD组男16例,女16例;年龄 22~50(33.28±9.28)岁;正常组男 11 例,女 17 例;年龄8~51(25.25±11.19)岁。两组受试者性别比较差异无统计学意义(P>0.05),但年龄比较差异有统计学意义(P<0.01)。排除标准:(1)患有眼部疾病或已知影响眼前节解剖结构情况的患者,如有眼部炎症、眼部手术史、佩戴隐形眼镜和(或)外伤史;(2)有影响睑板腺功能的全身用药史的患者;(3)患有任何其他已知会影响泪膜的眼部疾病或全身性疾病者。所有患者均由两位经验丰富的眼科医生根据眼部症状、睑缘异常和睑板腺评分诊断为阻塞性MGD。如果满足以下3个标准中的任何一个,则患者被诊断为阻塞性MGD:(1)眼部症状评分≥3分;(2)睑缘评分≥2分;和(或)(3)睑板腺评分≥3分[13]。只测量受试者的右眼。本研究经温州医科大学附属眼视光医院医学伦理委员会审批通过,所有受试者均签署知情同意书。
1.2 AI模型的训练和测试
1.2.1 图像预处理 使用眼表分析仪(德国 OCULUS Optikgerate GmbH欧科路光学仪器有限责任公司,型号:Keratography 5M)拍摄60例受试者右眼上下眼睑的睑板腺图像,并将其分为40幅训练图像和20幅测试图像。训练图像中的睑板腺由两位高级职称医师手动标注。在训练前,研究小组对40幅训练图像进行了如下的预处理。
(1)图像转换为灰度,如下所示:
Igray=Ir×0.299+Ig×0.587+Ib×0.114
其中,Igray是灰度值,Ir是RGB图像的R通道的值,Ig是RGB图像的G通道的值,Ib是RGB图像的B通道的值。
(2)标准化。使用以下公式对图像进行标准化:
其中,Xstd是像素标准值,Xgray是像素灰度值,μ是像素平均值,σ是像素标准偏差。
(3)归一化。使用以下公式对图像进行归一化:
其中,Xnorm是像素归一化值。
(4)直方图用限制对比度自适应直方图均衡调整。睑板腺图像不均匀,有些图像对比度低,有些曝光过度。因此,采用对比度受限的自适应直方图均衡化算法来提高全局对比度,防止在相对均匀的图像区域过度放大噪声。
(5)伽马校正。每个像素的亮度由以下公式调整:
其中,X[范围从(0,1)]是图像中的原始像素值,Y是调整后的像素值。
原始的图像(a)和预处理完成的图像(b)见图1。
图1 原始图像(a)和预处理图像(b)
由于数据集只有40幅图像,并且太小而无法训练一个CNN,因此笔者通过从每个训练图像中随机选择子图像块来进行数据增强,然后,使用80%的子图像用于培训,剩下的20%用于验证。图2显示了从40万个子图像中获得的40幅图像。
图2 子图像示例
1.2.2 系统设计与训练 本研究所使用的CNN结构是基于U-Net网络构建的。卷积层的滤波器数量为32、64、128、64和32。交叉熵用于损失函数,Adam用于学习速率优化。每个卷积层以整流线性单元(ReLU)作为激活函数,在两个连续的卷积层之间使用0.2的丢失率来防止模型过度拟合。CNN模型的网络结构见图3。
图3 卷积神经网络(CNN)模型的网络结构
在GTX 1070 8 G GPU上进行120代计算,并使用4个小批量补丁,对迷你U-Net的训练持续大约15 h后,验证集获得了最高0.895的交并比(intersection-ofunion,IoU),表明该模型已经过训练完成,可以从图像中提睑板腺。
预测图像的大小通常>64×64像素,因此研究人员需要将预测图像分成多个64×64像素的子画面。最后,将所有子图的结果合并,得到最终的预测结果。为了减少预测误差,研究人员使用5个像素作为水平和垂直步长来预测每个子画面。这意味着每个子画面将产生25个预测结果,研究人员将这25个预测结果的平均值作为子画面的预测结果。
研究人员通过传统的图像处理方法对图像进行预测,得到预测结果。提取步骤如下:(1)对图像进行中值滤波;(2)将图像二值化;(3)在图像中找到睑板腺的轮廓。如果两个等高线之间的垂直距离很小,则认为这些等高线属于同一个睑板腺并且是连接在一起的。提取的睑板腺在图4中以灰白色显示。
图4 提取的睑板腺
1.3 评价指标
1.3.1 睑板腺功能指标
1.3.1.1 眼表疾病指数(ocular surface disease index,OSDI)[14]所有受试者均接受OSDI问卷和眼部症状问卷调查,并回答是否存在14种MGD相关的眼部症状:眼疲劳、分泌物、异物感、干燥、不适感、黏稠感、疼痛、溢泪、瘙痒、发红、沉重感、眩光、过度眨眼和睑板腺囊肿或睑腺炎。根据出现的这些症状的数量,对症状从0~14进行评分,分数越高,说明症状越明显。
1.3.1.2 泪河高度(tear meniscus height,TMH) 使用眼表分析仪测量泪河高度并进行睑板腺红外拍照,TMH测量方法采用眨眼5 s后测量下眼睑中央TMH,正常值在0.20 mm左右。
1.3.1.3 泪膜破裂时间(tear film break-up time,TBUT)和角膜荧光素染色(corneal fluorescein staining,CFS)评分[13]滴入荧光素后进行CFS评分和TBUT测定。TBUT测定3次,取其平均值,正常值为>10 s。CFS评分标准如下:在5个区域(中央、颞、鼻、上、下)评估角膜荧光素染色(0个点=0,1~5个点=1,6~15个点=2,16~30个点=3,>30个点=4);如果发现融合染色,染料扩散到周围的上皮或基质,则根据融合区域的数量或角膜丝状物的存在进行评分(1个融合区域,加1分;2个或2个以上融合区域,加2分),染色评分范围为0~20分,分数越高,说明角膜上皮损伤越重。
1.3.1.4 睑缘异常评分 根据黏膜交界处前后移位、血管充盈、睑板腺孔堵塞、眼睑边缘不规则4项参数对眼睑边缘异常进行评分,每项评分0~4分,分数越高说明睑缘异常程度越大。
1.3.1.5 睑板腺表达能力评分[15]评分标准如下:0分,清亮的睑脂容易排出;1分,轻微压力下排出混浊的睑脂;2分,超过中等压力下才能排出混浊的睑脂;3分,即使很大的压力下也无睑脂排出。每个眼睑睑板腺表达能力评分范围为0~45分,分数越低说明睑板腺分泌功能越接近正常。
1.3.1.6 睑板腺评分[16]评分标准如下:0分,无萎缩;1分,萎缩面积<1/3的睑板总面积;2分,萎缩面积介于1/3~2/3的睑板总面积;3分,萎缩面积>2/3的睑板总面积。将上下睑的睑板腺评分相加,得到每只眼睛的睑板腺评分范围为0~6,分数越高,说明睑板腺萎缩越严重。
1.3.2 睑板腺形态指标 提取睑板腺腺体后,计算腺体的以下指标。
(1)睑板腺密度。计算每根睑板腺的面积(Smg)(以像素为单位),然后用每个睑板上所有腺体面积总和与睑板的面积(St)作对比,公式如下:
(2)平均眼睑睑板腺宽度。所有睑板腺宽度总和除以腺体数量,包括平均上眼睑睑板腺宽度、平均下眼睑睑板腺宽度、平均全眼睑睑板腺宽度。
(3)平均眼睑睑板腺长度。所有睑板腺长度总和除以腺体数量,包括平均上眼睑睑板腺长度、平均下眼睑睑板腺长度、平均全眼睑睑板腺长度。
(4)平均眼睑睑板腺弯曲度。所有睑板腺弯曲度总和除以腺体数量,包括平均上眼睑睑板腺弯曲度、平均下眼睑睑板腺弯曲度、平均全眼睑睑板腺弯曲度。
2 结果
2.1 两组受试者睑板腺功能指标比较 与正常组比较,MGD组患者TBUT减少,睑板腺表达能力评分降低,OSDI、睑缘异常评分和睑板腺评分均升高,差异均有统计学意义(均 P<0.01),见表 1。
表1 两组受试者睑板腺功能指标比较
2.2 两组受试者睑板腺形态指标比较 与正常组比较,MGD患者平均上眼睑睑板腺长度、平均下眼睑睑板腺长度和平均全眼睑睑板腺长度均明显缩短,上眼睑睑板腺密度、下眼睑睑板腺密度和全眼睑睑板腺密度均明显减小,差异均有统计学意义(均P<0.01)。两组受试者平均眼睑睑板腺宽度和弯曲度比较差异均无统计学意义(均 P>0.05),见表 2。
表2 两组受试者睑板腺形态指标比较
2.3 60例受试者睑板腺形态指标与功能指标的相关性分析 平均上眼睑睑板腺长度与TBUT、睑板腺表达能力评分均呈正相关(均P<0.05),与OSDI、睑板腺评分均呈负相关(均P<0.05);平均上眼睑睑板腺宽度与睑缘异常评分、睑板腺评分均呈正相关(均P<0.05);平均上眼睑睑板腺弯曲度与睑板腺表达能力评分呈负相关(P<0.05);睑板腺密度与TBUT、睑板腺表达能力评分均呈正相关(均P<0.05),与CFS评分、睑板腺评分均呈负相关(均P<0.05)。平均下眼睑睑板腺长度与TBUT、睑板腺表达能力评分均呈正相关(均P<0.05),与睑缘异常评分、睑板腺评分均呈负相关(均P<0.05);平均下眼睑睑板腺宽度与TBUT呈正相关(P<0.05),与睑板腺评分呈负相关(P<0.05);睑板腺密度与TBUT、睑板腺表达能力评分均呈正相关(P<0.05),与CFS评分、睑板腺评分均呈负相关(均P<0.05)。平均全眼睑睑板腺长度与TBUT、睑板腺表达能力评分均呈正相关(均P<0.05),与 OSDI、睑板腺评分均呈负相关(均 P<0.05);睑板腺密度与TBUT、睑板腺表达能力评分均呈正相关(均 P<0.05),与 OSDI、CFS评分、睑缘异常评分、睑板腺评分均呈负相关(均P<0.05),见表3。
表3 睑板腺形态指标与功能指标的相关性分析(r值)
3 讨论
本研究介绍了一个基于CNN的AI系统,该系统使用了计算机视觉领域的最新技术[17-18],可以自动分析睑板腺的形态,包括睑板腺长度、宽度、密度和弯曲度。计算机会在不断的训练中自动提取图片的高维度特征并建立这些特征与结果间的内在联系。这就在一定程度上排除了人为主观因素可能对结果产生的干扰。自动获取睑板腺腺体并计算其形态特征是一个巨大的挑战,以往的研究对输入图像有严格的要求,如果眼睑区域出现皱褶、反光等干扰因素时,会导致腺体的形状从规则的条状变形为片状或分散状,检测结果并不理想[19-20]。为了解决这一问题,本研究的算法对图像识别进行了优化,并将这些算法与传统的数字图像处理算法(如对比度调整、低通滤波、腐蚀、膨胀等)相结合,提高了相同背景下睑板腺的识别率。此外,由于使用了先进的图像分割模型和U-Net系统,即使在本研究中受试者人数较少,检测睑板腺形态的准确性也非常高(IoU达到0.895,重复率达到100%)。目前笔者团队仅使用GTX 1070 8 G GPU已经可以在100 ms内处理一张图片,随着算力的提高,使得数万幅图像在毫秒内同时完成分析成为可能。计算机辅助的睑板腺分析系统可以大大提高分析的准确性和效率,降低分析的成本,克服人工标记主观上的误差。睑板腺形态的详细分析是确定MGD严重程度的重要指标[21-22]。本研究比较了正常组和MGD组睑板腺长度、宽度、弯曲度和密度的差异。结果显示,MGD组患者平均睑板腺长度较正常组明显缩短,睑板腺密度也较正常组明显减小,但两组平均睑板腺宽度和弯曲度无明显差异。MGD患者的睑板腺分泌物排出阻力增加,睑板腺腺体的压力过大,眼表情况的进一步恶化,导致睑板腺病变的加重,睑板腺长度缩短,并且出现腺体的萎缩,导致睑板腺密度开始降低。如果病情得不到控制,睑板腺功能障碍进一步加重,睑板腺密度会进一步降低,直至接近0%。与之前的研究[23-26]相似,本研究中AI系统显示睑板腺的腺体长度和密度与症状、泪膜稳定性、睑缘异常评分和睑板腺表达能力均相关,说明睑板腺的腺体长度和密度可以作为计算机辅助的MGD诊断的有效指标。与以往的研究[5,26-28]不同,本研究采用高性能、高精度的AI系统,可以提取每个腺体并分析其长度、宽度、弯曲度等,每根腺体提取积累后在计算腺体面积和整个睑板面积的比例,精确度较传统的腺体面积计算方法大大提高。结果表明,AI系统能够准确地得到睑板腺的缺失面积,减少了由于分级过渡区附近的误差而导致的分级系统的不一致性和可变性。如果想要在人工分析中采用笔者团队的这种睑板腺分析方法是不现实的,因为这种分析方法需要大量的人工工作量,不可能作为常规的评估指标,但是AI系统的特点恰恰适合这种需要大量分析工作的任务。
本研究也有局限性。研究中使用的算法是一种通用算法。如果将该算法进一步发展成为专门针对睑板腺图像的一种特殊算法,则睑板腺形态识别有望获得更高的准确率。此外,本研究的样本量也较小,未来的研究中,笔者团队将招募更多的受试者来训练和测试AI系统。
综上所述,基于CNN的AI系统只需几十个训练实例就可以自动检测和识别睑板腺。它是一个准确、高效的睑板腺形态学评价系统,在临床上,该系统可以大大提高MGD诊断的灵敏度和准确度,减少观察者主观方面导致的误差,降低医务人员的工作量。在未来的研究中,将通过AI系统得到睑板腺形态各项参数,并进行一种更加细致的量化评分,从而提出一种新的客观的MGD形态学诊断标准,这具有非常大的市场前景和临床意义。