多核SVM在生物医学中的应用研究
2016-10-21刘卫华王春兰
刘卫华 王春兰
摘 要:以生物医学中实际分类问题为应用背景,提出一种基于半无限线性规划算法(Semi-Infinite Linear Program, SILP)的多核支持向量机(SVM)的分类诊断方法,并利用生物医学中典型的心脏单光子发射计算机化断层显像(SPECT)图像数据以及麻省理工学院(MIT-BIH)的心电图数据库中的数据进行训练和测试,仿真结果表明,这种改进的多核SVM分类器在分类精度、运行时间上都优于普通单核LSSVM与SVM,能够有效地处理实际分类问题。
关键词:分类问题;生物医学;心电图;多核SVM
1 概述
近年来,已有许多机器学习算法如决策树、贝叶斯分类、人工神经网络、小波变换、支持向量机(support vector machines, SVM)等用于生物医学实际分类问题中,其中SVM以结构风险最小化为原则[1],克服了传统统计分类方法的许多缺点。文章将一种改进的基于SILP算法的多核SVM[2]应用于生物医学中心脏单光子发射计算机化断层显像(SPECT)图像数据以及心电图ECG信号的分类诊断中[3]。
2 基于改进SILP算法的多核SVM
由于核学习强大的非线性映射能力,多核SVM越来越受到人们的重视,对于规模较大、分布不规则的数据样本,多核SVM具有更高的分类精度及更好的适用性[4]。
多核SVM的本质是将不同类型的核函数进行凸组合得到新的等价核函数[2]:
3 实验及结果分析
3.1 SPECTF图像数据试验
SPECTF数据集描述的是心脏诊断的单质子发射计算机断层摄影图像,该数据集有267个病人的SPECTF图像,每个病人被分为正常和不正常两大类[3],通过特征提取出44个特征用于训练。
文章在同等条件下,将基于SILP的不同核函数组合的多核SVM与经典LS-SVM、C-SVM进行实验。实验中SPECTF数据取80个样本为训练数据,剩下的作为测试数据。以下实验结果均为20次的平均值。
选取SPECTF数据中的两个属性作为横纵坐标,给出多核SVM对于测试数据的二维分类效果图如图1所示。
从表1可看出,对于SPECTF数据,几种方法都能达到较好的分类效果,从分类精度来看,基于SILP算法的多核SVM分类器略优于普通LS-SVM和C-SVM分类器,但从运行时间来看,同等条件下,基于SILP算法的多核SVM明显缩短了耗时[3]。
3.2 ECG数据实验
ECG数据是取自美国麻省理工学院心律失常数据库,把ECG信号分成正常的和不正常两类[8],通过特征提取,提取了74182个样本,每个样本有10个属性[9]。在实验中,随机选取40000个样本作为训练数据,其余的都作为测试数据进行实验[3]。仍在同等条件下,将多核SVM与经典LS-SVM、C-SVM和V-SVM进行实验,以比较其方法的分类性能。以下实验结果均为20次的平均值。实验结果如表2所示。
从表2可看出:几种分类器在选取各自理想参数值的情况下都能得到较好的分类精度。使用RBF多核函数的多核SVM略优于使用混合核函数的多核SVM,并且明显优于C-SVM和V-SVM,而且多核SVM与单核SVM相比,大大缩短了运行时间。说明此改进的多核SVM算法在解决大样本数据时,在分类精度不受影响的情况下会大大减少训练耗时。
图2给出了使用RBF多核函数的多核SVM对于ECG数据集分类的ROC曲线图。
4 结束语
文章将一种改进的基于SILP算法的多核SVM分类算法应用在生物医学中的心脏单光子发射计算机化断层显像(SPECT)图像数据和心电图数据,实验结果表明,与普通单核LSSVM和SVM相比,基于SILP的多核SVM分类算法在分类精度、运行时间以及适用的样本规模上都表现出了十足的优越性。
参考文献
[1]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.
[2]汪洪桥,孙富春,等.多核学习方法[J].自动化学报,2010,36(8):1037-1050.
[3]刘卫华.最小二乘支持向量机在分类中的应用研究[D].兰州:兰州交通大学,2013:9-4.
[4]汪洪桥,蔡艳宁,孙富春,等.多尺度核方法的自适应序列学习及应用[J].模式识别与人工智能,2011,24(1):72-81.
[5]刘卫华.MK-LSSVM与AdaBoost-SVM在分类中的比较研究[J].自动化仪表,2013,34(5):13-15.
[6]崔清亮,李军.多核学习方法在分类中的应用研究[J].科学技术与工程,2013,13(32):9531-9535.
[7]崔清亮.多核學习方法在分类问题中的应用研究[D].兰州:兰州交通大学,2014:32-39.
[8]王丽苹,董军.心电图模式分类方法研究进展与分析[J].中国生物医学工程学报,2010,29(6):916-925.
[9]赵传敏,马小虎.基于非负矩阵分解和支持向量机的心电图分类[J].计算机工程,2012,38(9):174-176.
作者简介:刘卫华(1987-),女,陕西富平,工学硕士,助教,研究方向:模式识别、图像处理等。