APP下载

Logistic多元回归和人工神经网络在判断进展期胃癌淋巴结转移中的应用

2016-10-25石张镇张文龙黄元平朱晓雪孙延霞

中国老年学杂志 2016年16期
关键词:人工神经网络分型进展

许 人 石张镇 张文龙 黄元平 朱晓雪 金 香 刘 蕊 孙延霞

(吉林大学第一医院二部,吉林 长春 130031)



Logistic多元回归和人工神经网络在判断进展期胃癌淋巴结转移中的应用

许人石张镇张文龙黄元平朱晓雪金香刘蕊孙延霞

(吉林大学第一医院二部,吉林长春130031)

目的应用人工神经网络及Logistic多元回归分析方法建立术前判断进展期胃癌淋巴结转移的诊断模型。方法分析行手术切除的700例胃癌患者术前资料,对性别、发生部位、浸润深度、病理类型等10项术前资料进行相关性分析,应用Logistic多元回归和人工神经网络建立术前判断进展期胃癌淋巴结转移的诊断模型。结果胃镜下Borrmann分型、肿瘤发生部位、病理类型及浸润深度4项因素对淋巴结转移情况有统计学意义(P<0.01),称为“危险变量”,而病史时间、首发症状、性别、年龄、吸烟史、饮酒史6项因素对淋巴结转移情况无统计学意义(P>0.05)。Logistic回归模型判断进展期胃癌淋巴结转移的准确率为69.3%,受试者工作特征(ROC)曲线下面积为0.771。根据4项“危险变量”建立的人工神经网络模型ANN1判断淋巴结转移情况准确率为70.4%,ROC曲线下面积为0.796。全部术前资料建立的ANN2判断淋巴结转移情况准确率为75%,ROC曲线下面积为0.831。结论在术前资料判断进展期胃癌淋巴结转移情况的研究中,ANN诊断的准确率高于Logistic多元回归分析模型,且术前资料越多,准确率越高,有望应用于临床,帮助相关科室提高判断淋巴结转移的准确率。

进展期胃癌;淋巴结转移;术前预测;人工神经网络模型;Logistic多元回归

进展期胃癌在我国所有胃癌中占92%~95%〔1〕。确定合理的术式及淋巴结清扫范围、制定个体化治疗方案是胃癌诊治的焦点〔2,3〕。但患者术前资料多而复杂,单一因素很难确定胃癌分期,且资料相关性小,难以综合评估并推测患者是否发生淋巴结转移。本文采用人工神经网络和Logistic多元回归方法对进展期胃癌淋巴结转移情况进行计量研究,探讨术前资料与淋巴结转移的相关性,提高诊断的准确率。

1 资料与方法

1.1一般资料2003年1月至2011年12月吉林大学第三临床医院行胃癌手术切除的700例进展期胃癌患者术前资料。其中男526例,女164例,年龄30~83岁,均行胃癌根治术+D1或D2淋巴结清扫术,术前未行任何抗肿瘤治疗,术后病理均为进展期胃癌,并证实是否有淋巴结转移。

1.2量化样本数据集总结既往文献报道的可能对进展期胃癌淋巴结转移有影响的因素,选择其中具有特征性的客观指标,包括性别、吸烟史、饮酒史、首发症状、病史时间(<1年,1~2年,>2年)、发病年龄(30~50岁,51~70岁,>70岁)、肿瘤发生部位、浸润深度、胃镜下Borrmann分型、病理类型共10项。

1.3统计学方法应用SPSS17.0统计软件进行χ2检验,Logistic多元回归分析。

2 结 果

2.1单因素分析胃镜下Borrmann分型、病理类型、肿瘤发生部位、浸润深度4项因素在判断淋巴结转移方面,各组差异有统计学意义,是进展期胃癌淋巴结转移的独立影响因素,为“危险变量”。而性别、年龄、病史时间、吸烟史、饮酒史、首发症状,各组发生率差异无统计学意义。见表1。

2.2构建人工神经网络模型ANN1自变量选择4项“危险变量”,将所有样本随机按7∶2∶1的比例输入训练组、测试组及验证组。训练组用于训练神经网络;测试组为用于跟踪训练过程中的错误以防止超额训练,对训练好的网络的泛化能力做出测试,以确定或肯定这个网络;验证组评估最终神经网络。输入层节点为17个,包括胃镜下Borrmann分型、肿瘤发生部位、病理类型及浸润深度;隐含层神经节点为5个(由经验而定),采用双曲正切传递函数;输出层神经节点2个,为淋巴结转移或无转移,采用Softmax传递函数。建立的ANN1见图1。应用ANN1对预测集样本预测,正确判断淋巴结有转移的准确率为92.5%,正确判断淋巴结无转移的准确率为28.6%,总准确率为70.4%,受试者工作特征(ROC)曲线下面积为0.796。

输入层节点为29个,包括性别、发病年龄、吸烟、镜下Borrmann 分型等10项术前资料;隐含层神经节点为8个(由经验而定),采用双曲正切传递函数;输出层神经节点2个,为淋巴结转移或无转移,采用Softmax传递函数,建立ANN2模型。应用ANN2对预测集样本进行预测,正确判断淋巴结有转移的准确率为74.0%,正确判断淋巴结无转移的准确率为76.9%,总准确率为75.0%。预测淋巴结转移的ROC曲线下面积为0.831。见图1。

表1 胃癌淋巴结转移影响因素的单因素分析(n)

图1 ANN

2.3构建Logistic回归模型Logistic多元回归结果显示:自变量“饮酒、病理类型、胃镜下Borrmann 分型、浸润深度”具有统计学差异(P<0.05);而性别、发病年龄、吸烟史、病史时间、首发症状、肿瘤发生部位差异无统计学意义(P>0.05),见表2。将10个自变量纳入Logistic回归分析,与进展期胃癌淋巴结转移具有显著相关性的变量按相关性由大至小顺序依次为胃癌的浸润深度、胃镜下分型、病理类型、饮酒史。系统自动将筛选出的上述有统计学意义的4个变量带入方程,随机抽取部分病例验证Logistic回归模型预测进展期胃癌淋巴结转移的情况,其准确率为69.3%,ROC曲线下面积为0.771。

表2 Logistic回归分析结果

3 讨 论

胃癌发病率和死亡率分别高达300.9/10万和29.3/10万。进展期胃癌具有发病率高、早期诊断率低、5年存活率低等特点〔4〕。术前判断进展期胃癌淋巴结转移情况十分重要。

Logistic回归具有判别和预测功能,适用于定性及半定量的指标,具有限制条件少,资料要求相对低等优点〔5〕。而人工神经网络则模仿生物神经网络的功能和结构建立数学模型〔6〕,具有很强的自适应、非线性特征,根据输出和输入因素间复杂的关系构建模型,能有效解决医学复杂问题,并在医学领域获得了广泛的应用〔7〕,可实现对疾病客观的检测和分类,提高疾病监测和鉴别诊断有效率〔8,9〕,适用于大样本、复杂样本的统计。本文提示ANN1、ANN2判断进展期胃癌淋巴结转移的准确率优于Logistic回归模型,其训练组、测试组及验证组间数据动态转换,相互校正,使准确率明显提高;Logistic回归模型可自动筛选出相关性大的指标作为“自变量”带入方程构建模型,方便可行,易于推广。上述两个模型各有优势,可辅助相关专业医生提高判断淋巴结转移的准确率。以后的研究将进一步扩大样本数量、联合影像学、肿瘤标志物等资料,完善该模型。上述模型能否对预后、疗效等进一步判断,还有待长期随访研究证实。

1郭丹阳,程文,周洋,等.胃窗超声造影、多层螺旋CT及两者联合诊断胃癌的价值比较〔J〕.中国临床医学影像杂志,2012;23(11):789.

2吕潇童,张军.进展期胃癌的治疗进展〔J〕.医学综述,2013;19(19):3513-4.

3Pasini F,Fraccon AP,de Manzoni G.The role of chemotherapy in metastatic gastric cancer〔J〕.Anticancer Res,2011;13(10):3543-54.

4赵敬柱,张汝鹏,王刚,等.进展期胃癌根治术后复发的预后分析〔J〕.中华胃肠外科杂志,2011;14(2):107-10.

5李建新,石张镇,郭贺,等.Logistic多元回归和人工神经网络在肺CT判断肺癌病理分型中的应用〔J〕.中国实验诊断学,2013;17(10):1800-3.

6张德丰,周灵,孙亚民,等.基于修剪技术分级学习的动态模糊神经网络算法研究〔J〕.计算机应用研究,2011;28(1):124-30.

7王刚,林森森,姜新国,等.用于小细胞肺癌诊断的人工神经网络模型〔J〕.中国卫生统计,2013;30(2):257-8.

8Vallejo M,Isaza CV,Lopez JD.Artificial neural networks as an alternative to traditional fall detection methods〔J〕.Conf Proc IEEE Eng Med Biol Soc,2013;20(13):1648-9.

9白雪峰,王平瑜,吴拥军.基于两种判别模式的肿瘤标志物联合检测对肝癌辅助诊断的价值〔J〕.解放军医学杂志,2012;37(11):1019-20.

〔2014-11-16修回〕

(编辑苑云杰)

吉林省科技厅自然科学基金资助项目(No.201215069)

孙延霞(1965-),女,博士,硕士生导师,主要从事血液病、恶性肿瘤研究。

许人(1986-),女,硕士,医师,主要从事肿瘤学研究。

R735.2

A

1005-9202(2016)16-3980-03;doi:10.3969/j.issn.1005-9202.2016.16.051

猜你喜欢

人工神经网络分型进展
HIV相关淋巴瘤诊治进展
晚期痴呆患者治疗及照护进展
Micro-SPECT/CT应用进展
扁平苔藓的诊断与治疗进展
利用人工神经网络快速计算木星系磁坐标
人工神经网络实现简单字母的识别
成人型髋关节发育不良的分型与治疗
基于改进人工神经网络的航天器电信号分类方法
复杂分型面的分型技巧
基于分型线驱动的分型面设计研究