基于血清肿瘤标志物的Logitboost模型用于肺腺癌和肺鳞癌鉴别的初步研究 *
2020-12-07张桐睿王广丽宋歌声
张桐睿,申 敏,王广丽,李 军△,宋歌声
1.山东第一医科大学研究生院,山东泰安 271016;2.山东第一医科大学第一附属医院/山东省千佛山医院放射科,山东济南 250014
近年来,肺癌的发病率逐年升高,严重威胁人类健康,也给患者家庭带来沉重的负担[1-2]。肺癌患者早期临床症状并无明显特征,极易被误诊、漏诊,等到发现时可能已是中、晚期,甚至发生了转移,生活质量和疗效大大降低[3]。有研究表明,在临床诊断肿瘤时应用生物标志物检测可达到理想效果,因此,血清肿瘤标志物在肺癌的早期诊断中受到越来越多的重视,血清癌胚抗原(CEA)、鳞状上皮细胞癌抗原(SCC)、神经元特异性烯醇化酶(NSE)、胃泌素释放肽前体(pro-GRP)、细胞角蛋白19片段(CYFRA21-1)在肺癌早期诊断、疗效监测及预后判断等方面的作用明显[4-5]。本文旨在利用肺癌患者血清中CEA、SCC、NSE、pro-GRP、CYFRA21-1的表达水平,建立二分类Logitboost模型,并评价该模型在鉴别肺鳞癌和肺腺癌中的准确性。
1 资料与方法
1.1一般资料 选取2018年1月至2019年6月山东第一医科大学第一附属医院收治并经病理学证实为肺癌的患者222例作为研究对象,男142例,女80例,年龄28~90岁。纳入标准:(1)初诊患者;(2)未进行过手术、放疗和化疗;(3)未并发血液系统疾病及其他部位恶性肿瘤。入选的222例患者中,肺腺癌125例(肺腺癌组),肺鳞癌97例(肺鳞癌组)。两组研究对象的性别、年龄比较,差异均无统计学意义(P>0.05)。
1.2方法 在清晨空腹状态下采集两组患者静脉血5 mL,静置20 min,然后3 000 r/min离心5 min分离血清,于-20 ℃冰箱保存。血清NSE、CYFRA21-1水平采用电化学发光法检测,使用的仪器设备及试剂为Roche Cobas E602全自动电化学发光分析仪及厂家的配套试剂;CEA、SCC、pro-GRP水平检测采用化学发光法,所用仪器设备和试剂为雅培i2000化学发光分析仪及厂家配套试剂。按说明书要求进行操作。
1.3统计学处理 应用SPSS20.0和Weka3.8.3软件进行数据分析。肿瘤标志物水平以M(P25~P75)表示,组间比较采用Wilicoxon两样本秩和检验。采用受试者工作特征(ROC)曲线分析血清肿瘤标志物对肺腺癌和肺鳞癌的鉴别诊断效能。将5种肺癌血清肿瘤标志物的检测数据用于拟合Logitboost模型,采用10折交叉验证对模型进行验证,并利用多种参数对模型效果进行评价。P<0.05为差异有统计学意义。
2 结 果
2.1两组血清肿瘤标志物的比较 5种肺癌血清肿瘤标志物中,SCC、NSE、pro-GRP、CYFRA21-1水平:肺腺癌组低于肺鳞癌组,差异有统计学意义(P<0.05);CEA水平:肺腺癌组高于肺鳞癌组,差异有统计学意义(P<0.05),见表1。SCC、NSE、CEA、pro-GRP、CYFRA21-1用于鉴别肺腺癌和肺鳞癌的ROC曲线下面积(AUC)分别为0.642、0.577、0.647、0.579、0.627。
2.25种肺癌血清肿瘤标志物拟合Logitboost模型 将5种肺癌血清肿瘤标志物拟合Logitboost模型后,训练集AUC为0.882;10折交叉验证后,验证集预测准确率为71.9%,AUC为0.784。见表2。
表1 5种肺癌血清肿瘤标志物在两组中的结果分析
表2 Logitboost模型训练集、验证集结果
3 讨 论
肿瘤标志物是反映肿瘤存在和增殖的一类生物活性物质。机体处于正常状态下,组织中的肿瘤标志物水平很低,而肿瘤组织中肿瘤标志物水平通常远远超过正常组织[6]。此外,肿瘤标志物检测在肺癌的早期诊断、治疗监测及预后判断中具有重要意义[7]。由于单一肿瘤标志物诊断特异度和灵敏度较低,因此,一般采用多种肿瘤标志物联合检测的方法来提高对恶性肿瘤诊断的灵敏度和特异度,以期在降低患者经济负担的同时,准确、有效地鉴别肿瘤的良、恶性[8]。
CYFRA21-1作为细胞角蛋白家族中具有重要作用的成员,当肿瘤细胞死亡或者发生溶解时,血清中CYFRA21-1水平明显升高,尤其在肺鳞癌中的表达较高,能作为肺癌诊断的一个首选标志物[9]。CEA作为肺腺癌诊断标志物之一,在肺腺癌患者中的水平较肺鳞癌和小细胞癌患者更高。NSE作为烯醇化酶的同工酶,不仅可以有效提示神经母细胞瘤,而且能明确提示小细胞肺癌[10]。SCC是应用单克隆技术从相关抗原TA4中提纯的糖蛋白片段,存在于子宫、子宫颈、肺等鳞状上皮细胞癌的细胞质中,早期肺癌患者血清中SCC的阳性表达率低,随着肺癌的发展而不断提高[11-12]。有研究表明,肺癌患者病情越严重,血清SCC水平越高[13]。而作为促胃泌素释放肽前体物质的pro-GRP是一种新型的肿瘤标志物,主要分布在神经纤维组织、脑部及肺部组织的神经内分泌细胞中。pro-GRP在正常上皮、良性肺疾病和上皮来源的肿瘤中表达水平低,而在肺癌组织(尤其是小细胞肺癌)中表达水平极高[14]。pro-GRP对于小细胞肺癌诊断具有重要作用,其特异度和灵敏度甚至超过NSE[15]。由于肺癌组织病理的多样性和抗原表达的异质性,肺癌的早期诊断仅靠单项肿瘤标志物检测是无法实现的,而肿瘤标志物的联合检测可以提高肺癌的检出率,降低漏诊率[16]。
Logitboost算法是一种基于机器学习的判别分类方法,在不能满足传统判别方法应用条件的数据中优势明显。本研究建立了二分类Logitboost模型,采用10折交叉验证对模型效果进行评价。结果显示,将5种肿瘤标志物的检测数据拟合Logitboost模型后,训练集AUC为0.882,验证集AUC为0.784,二者AUC接近,说明Logitboost模型用于鉴别肺腺癌与肺鳞癌具有可行性。
综上所述,通过对肺癌患者血清CEA、SCC、NSE、pro-GRP、CYFRA21-1 5种肿瘤标志物的联合检测,建立Logitboost模型,有助于肺腺癌和肺鳞癌的鉴别。