APP下载

探索基于特征代谢物和机器学习分辨良恶性甲状腺结节的方法

2022-07-29底锦熙陈振贺李晓东钟定荣

中日友好医院学报 2022年2期
关键词:滤泡代谢物探针

底锦熙,陈振贺,李晓东,李 洁,钟定荣*,曹 磊

(1.中日友好医院 病理科,北京 100029;2.岛津企业管理中国有限公司 中国创新中心,北京 100020)

随着超声检测技术的普及,甲状腺结节检出率越来越高。为明确结节的良恶性,行进一步甲状腺细针穿刺检查的病例中,恶性肿瘤的诊断率约4%~8%,其中甲状腺乳头状癌(papillary thyroid carcinoma,PTC)为主要类型[3],约占所有甲状腺恶性肿瘤的80%[1,2]。传统的细胞学诊断方法为金标准,但耗时耗力。2020年西湖大学的研究人员基于蛋白质组学和人工智能技术,发现了甲状腺癌的分子标记物,可用于甲状腺结节组织样本的快速诊断,临床应用准确率达到了90%以上[4]。PTC 组织存在很多特异性的代谢物[5,6]。课题组提出了采用探针电喷雾离子化质谱测量特征代谢物的离子强度,基于人工智能技术快速诊断PTC的技术方案。该方案尚未见任何文献报道。

本研究以细胞病理诊断过程中产生的废液作为样本,该废液包含一定浓度的特征代谢物,经简单的处理后,应用探针电喷雾离子化质谱进行分析,获得特征代谢物的离子强度。基于细胞病理诊断结果,采用支持向量机建立分类器,然后用于未知样本的良恶性的判定。

1 材料和方法

1.1 仪器与材料

探针电喷雾离子化质谱仪(DPiMS-8060,岛津,日本)。BD保存液(毕迪医疗器械上海有限公司,批号491336);甲酸(Dikma,批号5885877),乙醇(Fisher,色谱级,批号183349),超纯水(Milli-Q,18.2MΩ.cm)。

1.2 临床样本来源

收集2020年7月~12月期间在中日友好医院行甲状腺细针穿刺术的样本292 例。据甲状腺细胞学Bethesda诊断标准[3],由经验丰富的病理医生对样本进行诊断。PTC 镜下形态:(1)滤泡细胞呈乳头状和(或)成团片状,单层细胞排列,漩涡状细胞排列;(2)滤泡细胞的核特征:核增大;核呈卵圆形或不规则,有时出现核拥挤和重叠;纵行核沟;核内假包涵体;染色质粉尘状,核淡染苍白;可出现单个或多个小核仁,位于细胞核周边[3]。良性病变镜下形态:(1)含少量或中等数量的滤泡上皮细胞。(2)胶质丰富,稀薄的水样胶质常呈“薄膜样或玻璃纸样”外观,或出现较多皱褶,产生“碎石小径样”、“鸡笼铁丝网样”或“马赛克样”的外观;或是稠厚胶质的质地透明,且常有裂隙。(3)滤泡上皮细胞主要排列成单层片状,并在其中均匀分布(呈“蜂窝状”结构)[3]。剔除可疑及诊断不一致的病例,最终纳入289例样本。

PTC 和良性病例样本各109 例用于建立分类模型。单盲测试样本71 例用于评价分类模型,PTC 39例、良性病例32例。其中同时行BRAF 基因突变检测70 例,基因突变34 例、非突变36 例。有超声诊断71例,高危38例、低危33例。

1.3 样本的前处理

采集甲状腺细针穿刺样本制片过程产生的废液(离心后分离的上清液)0.4ml,加入1ml 含0.35% 甲酸的乙醇水溶液。吸取10μl 放入DPiMS-8060专用液体样品盘,启动分析。

1.4 质谱方法

采用探针电喷雾质谱仪(DPiMS-8060)对样本进行分析,DPiMS-8060由岛津三重四级杆质谱LCMS-8060 和探针电喷雾离子源(PESI)组成。PESI 和三重四级杆质谱参数如下:离子源采用PESI,脱溶剂线温度250℃,扫描模式Q3,加热块温度30℃。扫描时间:正负模式各0.1min;扫描范围:50~2000道尔顿。

PESI 取样时间50ms。探针电压:正模式2.3kV、负模式-3.0kV。取样位置46.0mm,探针清洗时间:正负模式各0.05min,离子化200ms,探针采样频率2.78Hz。

1.5 建模方法

采集细胞学诊断为PTC和良性病变的样本各109 例混合,建立数据库。将细胞学诊断分组的上清液样本进行质谱分析,获得特征代谢的离子强度。基于病理学诊断结果对用于模型学习的样品进行分组后,导入eMSTAT 软件(岛津,日本),采用偏最小二乘回归分析法(PLS-DA),归一化方法为TIC,质谱强度阈值1%,m/z识别范围:0.2Da;数值处理方法:Log10。采用支撑向量机(support vector machine,SVM)方法,边界约束(box constraint)和核函数范围(kernel scale)均设为自动,交叉验证类型:re-substitution。

1.6 评估指标

比较模型预测结果与细胞病理诊断、BRAF基因突变检测和超声检测的结果。用灵敏性、特异性和准确率来评价模型。

2 结果

2.1 模型建立

eMSTAT 软件提供2 种分组方法:PCA 和PLS-DA。图1和图2(见封底)分别为探针电喷雾离子源在PLS-DA 正模式和PCA 负模式下的分组结果。可见,正模式下PTC 组和良性组的样本都能更好地聚集,而负模式下PTC 组和良性组的样本相对分散。PCA负模式不能有效区分PTC组和良性结节,因此,最终采用正模式数据进行样品分析。

图1 PTC(蓝色点)和良性(红色点)样本的分组结果(质谱正模式)。

图2 PTC(蓝色点)和良性(红色点)样本的分组结果(质谱负模式)

2.2 单盲验证结果

以细胞病理诊断结果为参照,正模式质谱条件下的特异性、灵敏度和准确率为68.8%、53.8%和60.6%;负模式质谱条件下的特异性、灵敏度和准确率为62.5%、48.7%和54.9%。正模式质谱条件下,以BRAF 基因诊断、超声诊断作为参照,机器分类结果的准确率分别为60.0%和56.9%。

3 讨论

超声引导下细针穿刺结合细胞病理学诊断是甲状腺结节的良恶性鉴别最常采用的方法[7,8]。在常规的诊断流程中,对怀疑甲状腺癌的患者行穿刺术,或者穿刺液直接涂片,进行镜下观察;或是经过处理后显微镜下观察,处理过程通常先将穿刺液保存在合适的液基细胞保存液中,然后通过固定、离心、去上清、清洗及再离心等步骤得到干扰成分少的甲状腺细胞液基涂片,再进行镜下观察。如果仍不能确诊,还需要做分子病理检查是否存在基因突变。临床医生综合所有诊断结果做出最终诊断。人工智能阅片技术可以减少病理医生的重复劳动。有文献回顾了基于深度学习算法分析超声图像区分甲状腺结节良恶性的方法[9],还有文献系统综述了机器学习在甲状腺肿瘤超声诊断、细胞学诊断中的应用[10,11]。蛋白质组学技术与人工智能技术结合也被用于甲状腺结节的快速诊断。

PTC 表现为细胞遗传信息、蛋白质表达、基础代谢等发生改变[12~14]。基于BRAF 基因检测的PTC 诊断方法已经在包括中日友好医院等众多医院得到广泛应用[4]。基于蛋白质表达的变化和机器学习技术进行疾病诊断的方法也有报道[5]。然而,基于基础代谢变化和机器学习进行疾病诊断的研究却鲜未见报道。因此,我们设计了一种快速有效的PTC 诊断新方法:采用探针电喷雾离子化质谱仪(DPIMS)进行样品分析,快速获得样品中化合物的质核比(m/z)和离子强度。通过机器学习进行多变量分析(如PCA 和PLS-DA 等方法),获得在PTC 和其它疾病中种类和/或离子强度不同的化合物,并采用这些化合物去训练分类器,从而预测未知样本的良恶性。细针穿刺诊断过程中产生的废液(甲状腺穿刺细胞保存液离心后的上清液)中含有少量的代谢物为癌细胞的特征代谢物。为验证上述方案的可行性,采集了这些上清液作为实验样品。但是样本中的代谢物浓度非常低,影响了质谱检测的准确性和重复性,最终导致模型预测的准确率低,不能应用于临床。从方法验证的角度,准确率为60.6%,对后续研究具有显著的指导意义。

基于特征代谢物在质谱上的离子强度和机器学习构建的分类器,能够对PTC 和良性样本进行区分,但是准确率较低,可能存在以下原因:(1)入组样本的精细化区分。细胞病理学医生诊断为良性病变的病例,是一组病变的总称,又分为良性滤泡性结节、甲状腺炎或其他少见病变。良性滤泡性结节是甲状腺细胞学检查中最常见的类型,包括一组具有相似细胞学特征的良性病变,相应组织学诊断包括结节性甲状腺肿、腺瘤性结节、胶质结节和弥漫性甲状腺肿(Graves’病)的结节,以及一些滤泡性腺瘤亚型(大滤泡型)。甲状腺炎症性病变又包括淋巴细胞性甲状腺炎、亚急性甲状腺炎和急性甲状腺炎等。入组病例虽然均诊断为良性病变,但病变实质存在差异,对应样本的代谢产物及化合物也有所差异,强行统一进入单一组别,将影响诊断的准确性[3]。(2)入组和单盲测试样本的有效性。分析发现当前采用的样本的代谢物浓度不高。穿刺液样本首先制备涂片样本,残留在穿刺针上样本在18~20ml的细胞保存液种进行清洗和保存,然后离心并用高纯水清洗后的样本,再次制备液基细胞学涂片。我们采用的上清液样本中,虽然含有少量的特征代谢产物,但是浓度比较低。在扫描离子模式下,平均离子强度在103~104数量级,略高于噪声水平,在测定过程中受到的干扰比较大。(3)入组样本均一性。甲状腺细针穿刺过程中,由于结节大小、穿刺医生技术能力、患者配合度等多环节问题,造成最终恶性肿瘤细胞在样本中的含量有一定差异。

本次实验没有对上述参数进行有效控制和筛选,可能造成建模样本有效物质含量较低。以后可尝试用穿刺原液和术中冰鲜组织样本建库,提高样本质谱信号强度,来提高诊断准确性。

猜你喜欢

滤泡代谢物探针
一株红树植物内生真菌Pseudallescheria boydii L32的代谢产物*
腮腺沃辛瘤淋巴间质的免疫病理特征
蜈蚣败毒饮对银屑病小鼠滤泡辅助性T细胞相关因子STAT3及PD-1表达的影响
以皮肤结节为首诊表现的滤泡性淋巴瘤转化为弥漫性大B细胞淋巴瘤一例
揭示昼夜节律对玉米蛋白质与代谢组学的调控对杂种优势的贡献(2020.10.3 eplants)
鼻咽部滤泡树突状细胞肉瘤1例及文献复习
荧光探针在游离肼检测中的研究进展
肠道差自闭症风险高
通过接触测试来提高探针痕迹的一致性
我们的呼吸“指纹”