人工智能在锥形束计算机断层扫描影像中识别慢性根尖周炎根尖区病变的应用
2022-10-18钱军马芮曲妍邓少纯段瑶左飞飞王亚杰毋育伟
钱军 马芮 曲妍 邓少纯 段瑶 左飞飞 王亚杰 毋育伟
1.北京大学口腔医学院·口腔医院第二门诊部国家口腔疾病临床医学研究中心口腔数字化医疗技术和材料国家工程实验室,北京 100020;2.首都医科大学附属北京康复医院口腔科,北京 100144;3.北京朗视仪器股份有限公司,北京 100084
口腔临床工作中常见的慢性根尖周炎在组织学上主要表现为炎症细胞浸润及牙槽骨破坏,在影像学上主要表现为根尖周出现透射影像。完善的临床检查及高分辨率的影像学检查是其治疗计划的重要诊断工具,在根尖片、曲面体层全景片和锥形束计算机断层扫描(cone-beam computed tomography,CBCT)上可检测到慢性根尖周炎。由于根尖片的成本低及辐射剂量小的特点,目前在临床中应用最广泛。但与传统的根尖片和全景片相比,CBCT不受拍摄区域牙槽骨及牙齿结构影像失真和叠加的影响,显著增加了根管间、根尖病变及周围解剖结构的三维可视化[1]。
Meta 分析指出,根尖片的灵敏度和特异性(0.70、0.78)明显低于CBCT成像的灵敏度和特异性(0.95、0.88)[2]。近年来深度学习(deep learning)作为人工智能(artificial intelligence)的一个分支,在临床许多医学领域已经达到甚至超过临床专家的水平[3]。卷积神经网络(convolutional neural network)是其代表算法之一,它主要从图像中抽象出高度复杂的特征,进而构建一个自动识别模式的神经网络以进行自动判断和分类[4]。在口腔医学领域,卷积神经网络通过X 线片主要应用于检测龋齿病损部位、评估牙根形态及牙周骨质缺损等研究,但目前仍处于初级的阶段[2]。本文旨在探讨基于卷积神经网络算法的计算机辅助诊断系统在CBCT 影像中检测慢性根尖周炎的诊断应用。
1 材料和方法
1.1 样本选择
收集北京大学口腔医院第二门诊部2017 年1月—2021 年12 月罹患单根牙慢性根尖周炎的CBCT影像,总计49例患者55个样本。
纳入标准:1)均采用HiRes3D 型CBCT 仪器(北京朗视仪器股份有限公司)拍摄;2)技师的拍摄操作经过统一培训;3)设置相同的CBCT 拍摄参数:坐姿拍摄,100 kV,4 mA,360°旋转,拍摄持续时间12 s。CBCT 设备可以提供多个视野,像素间距0.125 mm×0.125 mm×0.125 mm,分辨率为640 px×640 px×640 px;像素间距0.2 mm×0.2 mm×0.2 mm,分辨率为800 px×800 px×250 px;像素间距0.25 mm×0.25 mm×0.25 mm,分辨率为640 px×640 px×400 px,医生可以根据具体情况选择最佳扫描方式;4)单根单病变(含单根牙及多根牙的单根病变)。
排除标准:1)病变同时累及多根(单颗牙或多颗牙);2)病变累及周边结构且无法区别病变界限,如:根分叉区、牙槽嵴顶、大面积骨皮质破坏、其他邻近解剖结构(上颌窦、下颌神经管、鼻腭管、颏孔);3)图像质量不佳或伪影过大(含金属伪影运动伪影或软组织对比度差)。
1.2 数据处理
1.2.1 学习样本的手动逐层分割 从49 例CBCT 原始数据中随机抽取6个根尖病变,慢性根尖周炎的CBCT 数据以DICOM 格式导出,图像由4 名主治医生先后2 次(间隔2 周)记录颌骨病变的位置并对于慢性根尖周炎病变区域进行识别同时使用Ma‐terialize Mimics Medical 软件进行手动逐层分割(图1)。在Statistical Package for Social Science 软件(SPSS V16,SPSS 公司,美国)用组内相关系数(intraclass correlation coefficiets,ICC)评估重复测量和测量者之间的一致性。
1.2.2 数据预处理 1)为了提高网络性能,加快训练速度,原始DICOM 数据需要进行预处理后再用于训练。使用的预处理包括数据归一化,数据增强(旋转、平移、添加噪声) 等。2) 按照80%、10%、10%将数据分为训练集、验证集和测试集,49 例患者CBCT 数据作为训练集,测试集和验证集各5例CBCT数据。
1.2.3 使用3D U-Net网络识别根尖病变 网络的总体结构如图2 所示,似U 型的网络由编码器(en‐coder)和解码器(decoder)组成。U 型左侧为编码器,编码器由3 个模块组成,每个模块经由2 个卷积层和1个池化层组成;每次卷积使用1个3×3×3 的卷积核,并且每次卷积之后经过1 个ReLU 激活函数。U 型右侧为解码器,同样是由3 个模块组成;每个模块先做1 次反向卷积,得到1 个高分辨率的特征图,再将高分辨率的特征图与左侧编码器部分对应的低分辨率的特征图结合;之后使用3×3×3 的卷积核做2 次卷积;最后一层的卷积是用1 个1×1×1 的卷积核实现的。除此之外,为了更好地训练网络并提升网络性能,使用深监督(deep supervision)的技术在网络右侧的隐藏层中增加了一个辅助分类器,这些辅助分类器作为网络的分支对主网络进行监督。使用Dice Loss+Cross Entro‐py Loss 作为损失函数,结合EarlyStop 和可调节学习率对网络进行训练。
1.3 手工分割和人工智能方法计算的比较
1.3.1 观察者一致性检验 ICC 用于评估检查者之间的一致性和可靠性,随机选取6例样本以确定观察者的一致性,观察者内部一致性由同一研究者在第一轮观察后2周进行重复分割计算。
1.3.2 人工智能分割效果的评估 使用交联比(in‐tersection over union,IOU)、Dice 系数(Dice)和像素精确度(pixel accuracy,PA)3 个指标对网络进行评估。
其中:Ground 是临床专家标注的病变金标准区域;Predict为人工智能预测病变区域。IOU即为真实病变区域与预测病变区域之间的重合程度,IOU值越高代表重合程度越高;IOU值越低代表重合程度越低。
其中:Ground 是临床专家标注的病变金标准区域;Predict为病变人工智能预测病变区域。Dice的取值范围为[0,1],Dice 越接近1,病变人工智能预测病变区域的结果与临床专家标注的病变金标准区域就愈加重合。
其中:TP(true positive)代表预测值为1,真实值为1 的部分;TN(true negative)代表预测值为0,真实值为0的部分;FP(false positive)代表预测值为1,真实值为0 的部分;FN(false nega‐tive)表预测值为0,真实值为1 的部分。PA 指的是人工智能预测病变正确的像素占图像总像素的比例,该比值越接近1,说明网络预测的准确性越高。
2 结果
2.1 一致性检验结果
测量者之间一致性的ICC 值为0.994(95%CI:0.986~0.998),测量者1 的自身重复测量的ICC 值为0.999(95%CI:0.990~1.000),测量者2 的重复测量ICC 值为0.995(95%CI:0.968~0.999),测量者3的重复测量ICC值为1(95%CI:1.000~1.000),测量者4的重复测量ICC值为0.999(95%CI:0.995~1.000)。
本研究中测量者的一致性检验ICC 相关系数值均>0.9,这些数值提示4 名医生的重复测量结果的差异无统计学意义。
2.2 深度学习测试集与验证集的参数结果比较
神经网络在测试集的结果如下:IOU为92.18%,PA为99.27%,Dice为95.93%。
神经网络在236轮迭代后停止,网络训练集和验证集的各指标都高于90%;并且训练集和验证集各指标提升趋势相似,均在前100 轮快速提升,之后趋于平稳(图3~6)。
3 讨论
随着深度学习和神经网络的应用,人工智能在医学领域中的应用正加速发展,而在口腔医学中的多个领域都有一定的研究应用,例如使用人工智能自动分类影像数据中的牙齿类型[5],分类计数下颌第一磨牙远中的根数目[6],利用深度卷积神经网络识别影像中的邻面龋坏[7],检测曲面体层片中的牙周骨质的缺损[8],利用人工智能检测CBCT中的根折[9]等。利用卷积神经网络检测成釉细胞瘤和牙源性角化囊肿,其一大特点是较临床医师的人工鉴别来说能节省更多时间[10]。对于那些系统病在口腔中的表现,也可用人工智能进行检测,包括骨质疏松症[11]和上颌窦炎[12]等。Ekert 等[13]使用卷积神经网络检测了曲面体层中的根尖周病损,其系统具有检测出根尖周病损的能力,但其敏感性仍有待提高。
一般深度学习网络需要大量数以千计的标记数据用于训练,而U-NET 可更高效地利用已有的标记数据进行自动分割和学习[14],这与本研究结果相一致。本研究选取了49 例患者的55 个数据,人工智能深度学习算法的U-NET 可以较好地检测出慢性根尖周炎根尖区病变,网络在测试集的IOU为92.18%,Dice为95.93%,PA为99.27%,这些指标表示网络在测试集性能较优,明显优于利用深度学习算法监测CBCT中根尖周低密度影的研究[15],其Dice为52%(其灵敏度为0.93,特异性为0.88)。人工智能在影像诊断中的误差较小,与其深度学习算法关系密切。深度学习算法的病变识别能力强于一般算法[16-17],其可以识别更加丰富的图像特征,包括人眼可识别的密度、形状、纹理等特征以及肉眼无法感知的一些图像特征[16-17],因此深度学习对CBCT 影像的解读具有一定的可靠性,基于本研究深度学习方法的人工智能系统,为下一步检测CBCT图像中的慢性根尖周炎奠定了基础。本文在收集数据集时纳入了不同视野及层厚的CBCT影像,更加符合数据在样本空间的分布情况,有利于增强算法的泛化能力,为今后算法应用于实际环境中提供依据,但同时不同视野及层厚的CBCT影像也增加了网络的学习难度,降低了分割的精度,为进一步提高人工智能算法学习效果,将在后续的研究中增大样本量。
CBCT影像可以在三维方向上观测慢性根尖周炎的病损大小,对病损实际范围及毗邻结构的识别更加清晰准确,这较根尖片以及曲面体层全景片具有明显优势,目前的CBCT成像技术尚存在一些局限性,比如:1)影像中高密度结构会因射线散射产生伪影(如根充物,高密度充填物,修复体或邻牙种植体);2)软组织显像对比度差,因而对部分病例来说,尤其是慢性根尖周炎累及骨皮质,存在无法区别病变界限的情况时,图像分割可能存在误差。由于以上原因,CBCT对于部分病例的应用尚存在局限性。
同时在本研究的过程中发现,人工智能在识别根尖周低密度影时,受到一些因素的影响,譬如慢性根尖周炎病变累及骨皮质骨缺损范围较大而无法区别病变界限时,颊舌侧骨板不完整会影响人工智能识别软组织与骨的边界,牙周牙髓联合病变表现的牙槽骨吸收与慢性根尖周炎形成的低密度影,邻近根尖病变的正常低密度影像结构(如切牙管、颏孔、下颌管、上颌窦等),累及多颗牙的大范围病变,有根充物的牙根,牙中牙、未闭合的根尖孔等。同时,为了增加人工智能的准确性,本研究还需增加样本量、合并解剖知识于人工智能的深度学习设计中。
利益冲突声明:作者声明本文无利益冲突。