机器学习在颌面部囊肿及肿瘤中应用的研究进展

2020-01-14梅宏翔程俊豪李一洲马凰税张恺文寿宇珂李杨

华西口腔医学杂志 2020年6期

梅宏翔程俊豪李一洲马凰税张恺文寿宇珂李杨

1.口腔疾病研究国家重点实验室国家口腔疾病临床医学研究中心

四川大学华西口腔医院，成都 610041；2.四川大学计算机学院，成都 610041

人工智能是指任何感知环境并采取行动以最大程度实现既定目标的设备。作为人工智能的核心，机器学习能评估给定数据集中的未知依赖关系，并用这种关系来预测新的结果。其主要包括两种类型：1）监督学习，使用标记过的训练数据集学习来建立模型；2）无监督学习，使用未标记的训练数据集的共同特征来建立模型。机器学习解决了如何自动改进计算机系统模型的问题，逐渐成为应用系统的首选开发方法[1]。医学作为数据密集型领域，机器学习在医学领域中具有极大的应用前景。研究[2]已经证明，与传统统计学方法相比，机器学习方法能够做出更为准确的肿瘤诊断及预后判定。口腔医学作为医学的分支学科，具备了医学临床思维的理念和方法。目前，研究者已经使用机器学习对临床检查图像、生化检测、基因组信息以及生活习惯等信息进行学习，以期能够对口腔颌面部疾病实现早期诊断、鉴别诊断以及预后预测。本文就机器学习在口腔颌面部囊肿及肿瘤中的应用进行综述。

1 图像识别

目前，组织病理及影像学图片是诊断口腔颌面部囊肿和肿瘤的重要指标，而图像识别技术在计算机领域逐渐成熟。图像需要经过预处理、图像分割、特征提取等处理后才能被纳入分类器中构建模型，不同的图像、处理方式及分类器将会决定模型的性能差异。

1.1 囊肿诊断

1.1.1 组织病理学图像囊肿的诊断主要依赖于组织学染色的图像，目前已经有许多研究对这一领域进行了探索。Landini等[3]早在2003年就开始研究口腔囊肿的上皮细胞分割方法。其对苏木精-伊红（hematoxylin-eosin staining，HE）染色图像使用颜色反卷积算法进行基于光密度的细胞核定位，去卷积提取核酸位置，直方图均衡化后通过设立光密度阈值分离出上皮区室，并通过分水岭变换将上皮图像分割为细胞轮廓。这样分割所得的不规则图像进行层距离变换以确定任意点的层级，循环进行，并引入局部向量以得到层的相对参考位置。这一研究首次提供了描述牙源性角化囊肿细胞的“栅栏状”和“极化”特征的定量测量方法。与Landini不同的是，Eramian等[4]主要着眼于口腔囊肿上皮的整体分割。其对HE染色图像进行亮度和色度的标准化处理后，根据色度标准进行阈值处理，初步将图像分割为组织和非组织区域。然后根据最大流算法获取最小切割并提取分割的二值图像，使用无向加权图的图形切割上皮细胞。但测试集检验发现该方法最优参数集的平均分割特异度仅为85%。这可能与较薄部位的过度分割有关。这些研究为构建口腔颌面部组织学图像的机器学习模型奠定了坚实的图像处理基础。

Landini等[5]于2006年使用上述算法[3]将HE染色的口腔囊肿病理图像分割成理论细胞区域并区分层级，提取出单个细胞的27种形态学计量参数（包括最大轴长等11种基础几何测量值和16种计算组合），并使用系统聚类法计算，成功地区分出牙源性角化囊肿和根尖囊肿，达到了96.7%的正确率，但对于角化囊肿亚型（单发型和痣样基底细胞癌综合征型）的区分度只达到了60%。而使用同样的方式处理图像后，Haar级联分类器对于上述2种囊肿的区分度能够达到100%，但对亚型的区分度也仅为60%。Frydenlund等[6]借鉴了Eramian的整体处理方法[4]以及Landini的分层处理技术[3]，并使用不同的色调表征不同的原始细胞成分，使得上皮层厚度、细胞形状、腺样结构以及角蛋白等差异均被纳入识别指征中，全方位描述了口腔囊肿的组织学图像特征。其选用了支持向量机（support vector machine，SVM）和基础学习者（base learner，BLR）2种分类器来构建数据模型，用于诊断4种牙源性囊肿（含牙囊肿、牙源性角化囊肿、侧牙周囊肿、腺牙源性囊肿），结果表明，SVM模型中验证集正确率为92.3%，BLR模型中验证集正确率为95.4%，二者训练前后标准一致性均接近1.0，而在去除含牙囊肿之后，准确率可以提升到96.2%。这些研究提供了口腔囊肿的一种定量测量方法，协助特征的提取和比较，可用于组织病理学的智能诊断，但其不能仅基于囊肿上皮结构区分角化囊肿上皮亚型。

1.1.2 锥形束计算机断层扫描（cone beam computed tomography，CBCT）图像 Okada等[7]首先采用随机游走分割（random walks segmentation）在CBCT中半自动区分出病变部位，并从分割区域自动提取8种图像特征，基于这些特征构建的LDA-AdaBoost分类器模型可以达到94.1%的准确度。Abdolali等[8]则在使用对称分析和活动轮廓分割出颌面部囊肿之后，分别使用轮廓波和球谐函数（spherical harmonics，SPHARM）进行外形和质地特征提取，并使用SVM和稀疏判别2种分类器对根尖囊肿、牙周囊肿和牙源性角化囊肿进行鉴别。当同时使用稀疏判别分析和正交化的SPHARM系数时，其可以实现96.48%的准确率。这些研究为临床椅旁鉴别诊断囊肿奠定了基础。

1.2 癌前病变诊断

1.2.1 临床数字图像早期实验仅对于临床采集的口腔黏膜白斑（oral leukoplakia，OLK）和口腔苔藓样病变的彩色图像进行了研究。由临床医生在口腔黏膜数字图像上描绘出病变区域、炎症区域和正常组织，再提取出基于形状的色度特征，最后将其纳入SVM分类器中构建自动诊断模型，成功地将89%的图像正确地区分为癌前病变和非癌前病变[9]。

1.2.2 组织病理学图像口腔黏膜下纤维化（oral submucous fibrosis，OSF）作为一种重要的癌前病变，其诊断及分级却尚无客观定量标准[10]。Krishnan等[11]通过多重阈值化处理技术来分割上皮下结缔组织，并用椭圆近似来获得偏心率以及用计算周长/面积来获得紧凑性，用SVM分类器根据这2种特征对上皮下结缔组织中的细胞按圆形和纺锤形进行分类。模型在OSF的诊断中已经达到了90.47%的灵敏度和88.69%的分类准确性。而该课题组另一研究[12]设计了基于纹理的分水岭技术，针对灰度、颜色及纹理的不连续性和局部相似性等元素对OSF组织学染色图像进行分割，采用小波、分形维数、布朗运动曲线、局部二值模式（local binary pattern，LBP）和Gabor小波变换提取出69种纹理特征，并以此设计SVM分类器。当bior3.1小波系数、LBP和Gabor小波变换相结合时，分类器能够达到88.38%的准确率。这些研究可能为OSF这一癌前病变的诊断和治疗方案制定提供参考。

1.2.3 脱落细胞图像 OLK作为另一种重要癌前病变，其临床评估在口腔鳞状细胞癌的早期诊断中具有极为重要的地位[10]。Liu等[13]开发了一种基于脱落细胞数据的OLK风险定量评估模型。该模型选取了脱落细胞的DNA指数，并通过对细胞群DNA的峰识别、二倍体/四倍体的提取和非整倍体的分离、信号放大和数据重建4个步骤完成数据转换和重建。在6种分类器构建的模型中，基于SVM的模型具有良好的灵敏度（0.939）和特异性（0.9444）。该模型能够对OLK患者进行风险评估并分级，以设立针对于高危人群的预防措施，提高临床随访的成本效益。

1.3 肿瘤诊断

1.3.1 组织病理学图像 Das等[14]首先用奇异值分解（singular value decomposition，SVD）的方法对组织学染色样本进行标准化处理，再用Otsu阈值处理与形态学算子提取出候选细胞，使用熵度量、分形维数和基于Hu’s矩描述符提取出12个描述特征，最终这些数据纳入随机森林（random forests，RF）模型以检测口腔鳞状细胞癌病理图像中的有丝分裂细胞，使其达到了89%的精确度、95%的灵敏度、97.35%的特异性和96.45%的受试者曲线下面积（receiver operating characteristic curve，AUC）。Rahman等[15]则使用MATLAB软件中的imadjust函数对组织病理图像标准化处理，采用直方图和灰度共生矩阵（gray level co-occurrence matrix，GLCM）提取出18种纹理特征（包括一阶和二阶），纳入线性SVM分类器以自动诊断口腔鳞状细胞癌，并达到了100%的准确率。

1.3.2 计算机断层扫描（computed tomography，CT）图像 CT是口腔恶性肿瘤诊断的重要依据。Pragna等[16]使用自适应中值滤波器对颌面部CT图像进行预处理，并选用Gabor滤波器来提取特征。其采用SVM分类器构建口腔肿瘤诊断模型，展现出97%的准确度和95%的灵敏度。Hu等[17]提出采用结合各向异性滤波器预处理CT图像，并选用模糊C均值聚类算法分割，随后又通过3种不同的算法[GLCM、一阶统计纹理（ first order statistical texture，FO）和灰度运行长度矩阵（gray run length matrix，GLRLM）]提取特征，最后使用基于SVM的机器学习方法对于口腔肿瘤进行分类，使其最高精确度达到90.11%。

1.3.3 共聚焦内窥镜（confocal endoscope，CLE）图像由于CLE具有无创性、极高放大倍数以及深度穿透等优势，在口腔黏膜疾病诊治中有着越来越大的应用前景[18]。Jaremenko等[19]率先使用基于组织特征的经典模式识别（局部二值模式、GLCM或局部直方图统计等）作为分类依据，并用RF和SVM两种机器学习算法来自动识别口腔癌患者和健康人黏膜的CLE图像，在诊断口腔肿瘤方面分别达到了98.0%和99.2%的准确率。Ditt berner等[20]参考上述图像处理方法来提取头颈部CLE图像特征向量，并使用非线性SVM分类器来学习肿瘤和非肿瘤的差异，得到0.776 0的AUC值和74.60%的平均交叉验证准确度。作为重要的无监督学习方式，卷积神经网络（convolutional neural networks，CNNs）是一种不以特征提取为基础的深度学习方法。一项研究[21]对来自于4个区域的口腔鳞状细胞癌进行诊断，平均准确率为88.3%（灵敏度86.6%，特异性90%）。然而，由于深度学习未知数较多，所需计算的参数更多，因此需要纳入更大量的数据。

1.3.4 生化检测图像 Zlotogorski-Hurvitz等[22]测量口腔癌患者和健康人群唾液外泌体的傅里叶变换红外吸收光谱，并通过Savitsky-Golay平滑算法减少噪声和标准化，最后通过主成分分析—线性判别分析（principal component analysis-linear discriminant analysis，PCA-LDA）和SVM分类算法分别建立诊断模型，发现这2种模型的准确率分别达到95%和89%，这一研究人群较少，降低了该研究结果的可靠性，但为基于核酸、蛋白质、脂质结构/数量变化的口腔癌早期诊断提供了新的研究方向。

2 临床决策支持系统

研究[23]根据临床诊断流程，综合患者基本信息、临床表现、临床检查结果、病理报告结果甚至基于大数据等构建自动诊断专家模型，利用多种信息模拟临床诊断过程得出准确的诊断及预后预测结果，辅助医生临床决策。

2.1 肿瘤诊断

Mohd等[24]选取了14个临床病理特征（包括人口统计学特征、临床体征和症状、组织病理学特征和肿瘤早期特征）构建早期口腔癌诊断模型，结果显示SVM在预处理阶段将特征子集选择与合成少数类过采样技术（synthetic minority oversampling technique，SMOTE）相结合后，其对口腔癌初期诊断的准确度优于其他机器算法（包括可更新朴素贝叶斯、多层感知器和K最近邻等）。结合之前的研究提示，基于SVM的图像识别技术可能成为口腔肿瘤的识别诊断、临床分期模型构建的首选方法。

2.2 肿瘤预后预测

Turki等[25]基于现有的基因高通量测序数据来预测口腔癌的发展，并对SVM分类器进行了改进，使准确度、AUC等性能均优于SVM和Xgboost这2个传统的分类器模型。Exarchos等[26-27]选取了临床、影像、组织和血液基因组数据并构建贝叶斯网络模型。虽然他们声称该模型对口腔恶性肿瘤复发风险的预测准确度已达到了100%，但超过70个标记物的数据需要极大地限制了临床应用。Chang等[28]仅选取15项临床病理数据和2项基因型（p53和p63）数据进行随机组合，并选用自适应神经模糊推理系统（adaptive neuro-fuzzy inference system，ANFIS）、人工神经网络（artificial neural network，ANN）、SVM、逻辑回归（logistic regression，LR）4种分类器进行学习和构建口腔恶性肿瘤预后预测模型。该研究发现，饮酒史、侵袭性和p63这3种输入特征结合ANFIS分类器能实现最佳的准确度（准确度=93.81%；AUC=0.90）。Carnielli等[29]针对唾液样本构建了基于蛋白组学的口腔鳞状细胞癌淋巴结转移的预测模型。首先，其发现在肿瘤侵袭前沿中有7种蛋白质存在差异性表达，采用RF对唾液中的这7种蛋白质构建模型发现，白三烯水解酶A4（leukotriene A-4 hydrolase，LTA4H）、胶原蛋白α-1 [collagen alpha-1（Ⅵ）chain，COL6A1]和胱抑素-B（cystatin-B，CSTB）组合对淋巴结转移预测性能最高。这些研究将为临床预测口腔恶性肿瘤预后情况提供新的方法，并为临床医生进行医疗决策提供参考。

3 展望

医学作为一个成熟领域，拥有着精密的诊断思维模式、海量医学图像。而这些则可以转换为机器学习领域所必需的算法和数据。本文提到的许多研究均认为，基于SVM的机器学习方法相比于其他分类器而言，是医学图像识别、智能诊断以及临床信息分析的较佳算法，在口腔医学领域的临床应用中具有极大的潜能。随着组织病理图像处理技术的发展，更多的图像特点能够被纳入到机器学习中，这也使得基于图像特征的颌面部囊肿及肿瘤辅助诊断水平逐渐提高。而临床决策支持系统由于要求的信息量大且质量高，尚不便于在临床中推广。

同时，由于机器学习仍然是一个年轻的领域，大多数机器学习算法的目标是从单一的数据源中学习一个特定的功能或数据模型。但是人类的知识和技能是从多年不同的训练经验中获得，这些经验包括了多种学习方式，如监督性、无监督性以及序列学习等。所以即使扩大了临床样本的类型，机器学习在模拟临床诊断思维上仍可能较为局限。

综上所述，今后仍需要在计算机领域和口腔医学领域开展进一步的合作，将临床问题、临床思路、临床方案通过计算机算法模式展现出来，并将数据合作共享，共同合作，开发出能达到临床应用级别的软件，优化资源配置，促进优质医疗资源下沉，解决医疗资源分布不均等问题。

利益冲突声明：作者声明本文无利益冲突。