基于BP神经网络的肝癌放疗致乙型肝炎病毒再激活分类预测模型
2016-05-03吴冠朋王帅黄伟刘同海尹勇刘毅慧
吴冠朋 王帅 黄伟 刘同海 尹勇 刘毅慧
摘 要 研究针对原发性肝癌(primary liver carcinoma, PLC)患者精确放疗后乙型肝炎病毒(Hepatitis B virus, HBV)再激活分类预测模型,采用logistic提取关键特征子集,发现外放边界、肿瘤分期TNM和HBV DNA水平是HBV再激活的危险因素(P<0.05)。建立BP神经网络分类预测模型,对原发性肝癌初始数据集和关键特征子集进行HBV再激活分类预测。实验结果表明,BP网络对HBV再激活有着良好的分类预测性能,分类预测准确性从73.33%提高到78.89%,关键特征子集分类预测准确性高于初始数据集分类预测准确性,表明了特征提取后的关键特征子集具有优秀的类别区分性。
关键词 PLC ;HBV再激活;特征提取;BP神经网络
中图分类号 TP391 文献标识码 A
Classification prognosis model of hepatitis B virus reactivation after radiotherapy in patients with primary liver carcinoma based on BP neural network
Wu Guanpeng1, Wang shuai1, Liu Tonghai2, Yin Yong2, Huang Wei2, Liu Yi hui1
(1 School of Information, Qilu University of Technology, Jinan 250353,China;2 Department of Radiation Oncology, Shandong Cancer Hospital, Jinan 250117, China)
Abstract This study aims at the classification prognosis model of hepatitis B virus (HBV) reactivation after precise radiotherapy(RT) in patients with primary liver carcinoma. Using logistic regression methods to extract the key feature subset. Finding the outer margin of RT, TNM of tumor stage and HBV DNA level were the risk factors(P<0.05) of HBV reactivation. Build classification prognosis model of BP neural network, classification prognosis of HBV reactivation for original data subset and the key feature subset in patients with primary liver carcinoma. Experimental results show that BP neural network has a good classification prognosis performance of HBV reactivation, the classification prognosis accuracy increased from 73.33% to 78.89%.The classification prognosis accuracy of the key feature subset is superior to original data subset, and the key feature subset has excellent classification of distinction after feature extraction.
Keywords Primary liver carcinoma; HBV reactivation; feature extraction; BP neural network
0 引 言
原发性肝癌(primary liver carcinoma, PLC)患者精确放疗后可以致使感染乙型肝炎病毒(Hepatitis B virus, HBV)发生再激活,HBV[1]再激活可达20-25%左右,这类患者常伴有预后不良现象,死亡率达25%。找出HBV再激活的危险因素和建立HBV再激活分类预测模型对感染HBV的原发性肝癌患者的抗肿瘤治疗具有重要临床意义。韩国学者Kim等[2]在2007年对32例经三维适形放疗(three-dimensional conformal radiotherapy, 3D-CRT)的原发性肝癌患者进行研究,推断HBV DNA水平可
能是引起HBV再激活的危险因素。无独有偶,吴晓安等[3-4]也相继推断HBV再激活患者死亡原因与HBV DNA复制活动密切相关。黄伟等[5]则于2013年通过对69例精确放疗的原发性肝癌患者采用logistic法回归分析各项指标对HBV再激活的影响,发现基线血清HBV DNA水平是HBV再激活的独立危险因素。该研究组随后将精确放疗剂量学参数引入研究,又相应发现一些剂量学参数也是引起HBV再激活的高危因素[6]。综上所述可知,原发性肝癌患者精确放疗后致HBV再激活的危险因素有待进一步研究,相关预测模型也随之步入建立预期阶段。
迄至目前,特征提取已广泛应用于生物医学领域的复杂数据分析,诸如即已应用在质谱数据分析方面[7-8]。与此同时,BP神经网络也已在各大领域范围获得了全面推广应用,例如现已普遍应用在胶囊异物缺陷识别[9],纸币面向识别 [10],车牌字符识别[11],肝脏31P磁共振波谱分析[12,13]和红细胞浓度无创检测[14]等多个热点研究方向中。基于此,本文将使用logistic回归分析检测分析得出外放边界、肿瘤分期TNM、HBV DNA 水平是HBV再激活的危险因素(P<0.05),同时建立BP神经网络分类预测模型,进而分别对初始数据集和经特征提取后的关键特征子集进行HBV再激活分类准确性预测。
结束语
本文针对原发性肝癌精确放疗后致HBV再激活的问题,对于不同数据类型的临床特征采用不同的特征提取方法,将得到显著性因素再纳入logistic回归分析中,发现HBV DNA 水平、外放边界和肿瘤分期TNM是HBV再激活的危险因素,即具有类别区分性的特征子集。然后对原发性肝癌患者初始数据集以及特征子集建立BP神经网络分类预测模型,分类预测结果表明:
(1)影响原发性肝癌患者发生HBV再激活的危险因素很多,
临床数据量大,传统方法难以构建准确的预测模型,不能找出HBV再激活相关的关键信息。而BP神经网络有着较强的模式识别能力,特别是特征提取后的关键特征子集在BP神经网络分类预测模型中的分类性能更优,有效降低了数据维度,并且提高了HBV再激活的分类预测准确性。
(2)BP神经网络在HBV再激活分类预测中具有较高的应用价值,可对已感染HBV的原发性肝癌患者采取抗病毒以及肝保护等治疗方法,以提高原发性肝癌患者的生活质量,延长生存周期。今后将继续研究其他智能算法模型在HBV再激活研究的应用,并致力于提高HBV再激活分类预测性能。
参 考 文 献
[1] YEO W, LAM KC, ZEE B, et al. Hepatitis B reactivation in patients with hepatocellular carcinoma undergoing systemic chemotherapy[J]. Annals of Oncology, 2004, 15(7): 1661-1666.
[2] KIM JH, PARK J W, KIM TH, et al. Hepatitis B virus reactivation after three-dimensional conformal radiotherapy in patients with hepatitis B virus-related hepatocellular carcinoma[J]. International Journal of Radiation Oncology Biology Physics, 2007, 69(3): 813–819.
[3] 吴晓安,章志勇,严志彪,等. 原发性肝癌三维适形放疗的临床研究[J]. 临床肿瘤学杂志, 2008, 13 (6): 538-540.
[4] 吴晓安,章志勇,洪节约,等. 三维适形放疗治疗86例肝癌的临床疗效分析[J]. 实用癌症杂志, 2007, 22(4): 373-375.
[5] 黄伟,卢彦达,张炜,等. 原发性肝癌精确放疗致乙型肝炎病毒再激活分析[J]. 中华放射肿瘤学杂志, 2013, 22(3): 193-197.
[6] HUANG W, ZHANG W, FAN M, et al. Risk factors for hepatitis B virus reactivation after conformal radiotherapy in patients with hepatocellular carcinoma. Cancer science, 2014, 105(6): 697-703.
[7] Liu Y H. Feature extraction and dimensionality reduction for mass spectrometry data [J]. Computers in Biology and Medicine, 2009, 39(9): 818-823.
[8] 李义峰,刘毅慧. 基于遗传算法的蛋白质质谱数据特征选择[J]. 计算机工程, 2009, 35(19): 192-197.
[9] 陈毅, 刘晓玉, 刘斌,等. 基于BP神经网络的胶囊异物缺陷识别[J]. 计算机应用与软件, 2015(3): 196-199.
[10] 刘艳萍, 杜秋晨, 张进东. 基于BP神经网络的纸币面向识别方法[J]. 计算机应用与软件, 2015, 32(11): 176-179.
[11] 莫林,凌文彪,张福元,孙学彬. 基于评分模型的车牌字符识别方法[J]. 计算机应用与软件, 2015, 05: 203-206.
[12] 王韶卿,刘毅慧,王丽娟,等.基于反向传输神经网络的肝脏31P磁共振波谱分析[J]. 中国医学影像技术, 2009, 25(10): 1875-1878.
[13] 王韶卿,刘毅慧,付婷婷,等. 肝癌31磷磁共振波谱数据的分类[J]. 山东大学(医学报), 2009, 47(6): 42-47.
[14] 张宝菊,雷晴,李刚,等. 基于BP神经网络的人体血液中红细胞浓度无创检测[J].光谱学与光谱分析,2012,32(9):2508-2511.
[15] 申希平,丁建生,李娟生,等. 在SPSS中利用均数和标准差做两独立样本 检验[J]. 现代预防医学, 2007, 34(21): 4066-4067,4069.
[16] 胡文敏,何婷婷,张勇. 基于卡方检验的汉语术语抽取[J]. 计算机应用, 2007, 27(12): 3019-3020+3025.
[17] 谢娟英,高红超. 基于统计相关性与K-means的区分基因子集选择算法[J]. 软件学报, 2014(9): 2050-2075.
[18] 米根锁,王彦快,马学霞. BP神经网络在轨道电路分路不良预警中的应用[J]. 计算机工程与科学, 2013, 35(2): 159-163.
[19] 陈飞彦,田宇驰,胡亮. 物联网中基于KNN和BP神经网络预测模型的研究[J]. 计算机应用与软件, 2015, 06: 127-129+202.
[20] 邱龙金,贺昌政. 神经网络稳定性的交叉验证模型[J]. 计算机工程与应用, 2010, 46(34): 43-45.