基于BRAF 基因构建穿刺结果不明确的甲状腺结节诊断模型
2021-10-20徐吉张燕
徐吉,张燕
作为最常见的内分泌疾病,甲状腺结节可在大约5%的女性和1%的男性中出现,且在50%的60 岁以上人群中出现[1]。大多数的甲状腺结节患者预后良好,终身无需手术,但有7%~15%的结节为甲状腺恶性肿瘤[2]。在甲状腺结节良恶性的判别中,除了手术病理“金标准”结果外,超声引导下的细针穿刺细胞学检查(FNAC)因其微创、易实行及准确率较高的特点,被作为术前鉴别甲状腺良恶性结节的辅助诊断方法,在临床中已被广泛使用[3],然而对于穿刺结果中不明确的细胞非典型性病变或滤泡性病变(AUS/FLUS),目前仍然没有良好的进一步明确诊断方法,因此开发新型的AUS/FLUS类别诊断模型以提高术前甲状腺良恶性结节鉴别诊断效能成为本研究的重点[4]。现报道如下。
1 资料与方法
1.1 一般资料 本研究最终入选82 例甲状腺结节患者,均于2017 年1 月至2019 年12 月在中国科学院大学宁波华美医院超声介入科就诊,所有患者均签署知情同意书,且本研究得到医院伦理委员会批准。纳入标准:(1)FNAC 结果为AUS/FLUS类别;(2)具有明确的手术病理结果;(3)行BRAF 基因突变检测与常规甲状腺二维超声检查。排除标准:(1)甲状腺结节FNAC 结果为标本无法诊断或不满意、良性、滤泡性肿瘤或可疑的滤泡性肿瘤、恶性肿瘤;(2)既往甲状腺肿瘤病史,结节复发或行2 次手术的患者;(3)资料不齐或对研究过程抵触的患者。
1.2 方法 KNN诊断模型的构建:本研究统计分析及KNN 诊断模型的构建均使用R 3.4.3 软件完成,并采用ROC 曲线分析。首先将各变量指标转换为数值型(表1)以便于后续数据处理,82 例患者使用图1 中的流程构建KNN分类器,将82 例患者分为训练数据集(50 例)与测试数据集(32 例),在训练数据集中首先使用LASSO+10 倍交叉验证的方法,最终确定分类错误最低时的K 值,将该K 值在测试数据集中验证,最终在最初82 例患者构成的数据集中再次验证,以评估分类器的性能。
表1 诊断模型中变量的转换
图1 KNN 分类器构建流程
2 结果
2.1 BRAF基因检测结果与手术病理结果的关系 BRAF基因检测的灵敏度为71.7%(43/60),特异度为72.7%(16/22),阳性预测值为87.8%(43/49),阴性预测值为48.5%(16/33),见表2。
表2 BRAF 基因检测结果及手术病理结果对比 例
2.2 判定模型的构建 对各变量的重要性进行评估确定分类错误率最低时的变量个数,结果表明在变量数为4个时,分类器的错误率最低,而在随机森林算法中,BRAF 基因结果、结节回声、结节形态、结节边界这4项变量对分类器的性能最为重要。最终使用以上4 种变量构建了KNN分类器,在K=18 时分类器的错误率最低。
2.3 KNN分类器性能的评估 KNN分类器模型的AUC 为0.842,优于单项指标构建的KNN分类器,同时该分类器的敏感度为91.8%,特异度为84.9%,见表3 ~4。
表3 KNN 分类器模型与各项指标单独构建模型的ROC 曲线分析
3 讨论
近年来,由于高分辨诊断技术的发展及环境因素等影响,甲状腺癌的发病率与检出率在全球范围内都呈现递增趋势[5]。现临床上FNAC 作为术前鉴别诊断甲状腺肿瘤性质已被广泛使用[6]。采用国际公认的Bethesda报告系统[7]对穿刺标本进行解读,其中85%~95%的穿刺结果可明确诊断,但由于受多灶、大小、细胞病理学医生的经验及恶性肿瘤细胞形态特征的混杂等多种因素影响,仍有部分结果不能明确[8]。另有研究表明,甲状腺癌发病率在AUS/FLUS类别中为5%~15%[9]。上述结果说明该类别患者中必定存在良性结节患者接受过度治疗及恶性结节患者未得到有效治疗的情况,因此也更需要检测特异性更高的手段来提升术前鉴别诊断甲状腺良恶性结节的准确性。
表4 KNN 分类器模型在甲状腺良恶性结节中的诊断价值 例
有研究表明BRAF基因突变在结肠癌、直肠癌、卵巢癌和甲状腺癌均有发现[10]。有研究通过观察292 例细胞学检查为良性的高危甲状腺结节患者,结果表明在其中36 例BRAF 基金突变患者中,31 例患者最终出现恶性甲状腺结节,这表明BRAF 基因的筛查能够降低细胞学检查的假阴性率[11]。本研究结果也说明BRAF基因检测作为一个单独检测指标而言,阳性预测值较高,故认为使用BRAF基因检测作为诊断指标能够很好的改进现有的诊断模型。但同时笔者发现BRAF基因无突变但手术治疗的33 例患者中有17 例为恶性结节。这表示若只应用BRAF基因检测作为衡量该类患者是否需要手术的唯一指标,仍存在不确定性。
为进一步探讨快速高效的诊断方法,笔者运用机器学习的方法构建诊断模型,将已收集的各变量对甲状腺结节良恶性分类的重要性进行研究。在随机森林算法中,得知BRAF 基因、结节回声、结节形态、结节边界这4 项变量对分类器的性能,也就是鉴别该类别的甲状腺结节良恶性最为重要,且BRAF基因的重要性远高于其他变量,更进一步确定了BRAF 基因在鉴别诊断甲状腺结节的重要作用。本研究中构建的KNN 分类器模型的灵敏度为91.8%,特异度为84.9%,优于单项指标BRAF 基因检测的灵敏度及特异度。除此之外,该KNN 分类器模型的AUC也优于各指标单独构建的分类器模型。这证实了该分类器对于诊断甲状腺良恶性结节有一定的潜力。
但在本研究中,对于变量的纳入仍有所欠缺,目前对于甲状腺结节的辅助检查还包括超声弹性成像(SWE/UE)、超声造影成像(CEUS)等,基于此,笔者认为下一步研究方向可使用上述机器学习方法,扩大变量的纳入范围对穿刺结果不明确的甲状腺结节进行多模态的综合分析,从而使甲状腺癌的检出率进一步提高,实现为患者提供个体化精准治疗的期望。