基于支持向量机的快速核素识别方法研究
2014-02-17谢先博张晖
谢先博 张晖
摘要:针对传统[γ]能谱核素识别算法在较低放射性水平下的情况下存在核素识别慢,对相干核素识别效果差的问题,基于统计学习理论提出了基于支持向量机的快速核素识别方法。本方法一方面通过对峰位确定方法改进来提高特征量提取的精确度,去除[γ]能谱中重叠峰对相干核素识别中的影响,另一方面使用支持向量机方法实现核素的快速分类。通过与传统方法的比对,新方法在识别相干核素方面达到了很好的识别效果。
关键词:核素识别;支持向量机;B样条平滑
中图分类号:TP181 文献标识码:A 文章编号:1009-3044(2014)02-0355-04
传统的基于[γ]能谱解析进行核素识别的算法[1],在较低放射性水平下的情况下,存在核素识别速度慢,对“相干核素”(多种核素混合)识别效果较差的弱点。核素识别问题从本质上可以看成一个机器学习中的分类问题,虽然分类的方法很多,由于核素识别过程中获取样本数据较困难,训练集较小,适合使用支持向量机的分类方法来进行识别。支持向量机(Support Vector Machines, SVM) 作为一种较新的机器学习方法, 具有出色的学习及推广能力, 在很多领域都得到了成功的应用, SVM 能够较好地解决小样本、非线性、高维数和局部极小点等实际问题,具据有较高的分类能力和计算效率。与此同时本文对确定峰位及特征值提取做了改进和优化相较于文献[1][[1]]提出的核素识别算法及BP神经网络算法,提高了重叠峰的识别率,很好解决了相干核素的识别问题,找到了一种快速、有效、稳定的核素识别算法。
1 数据预处理
[γ]能谱数据预处理主要包括谱数据平滑、峰位确定、本底扣除等几个主要环节。为了在SVM分类达到较好的效果,必须对这几个环节进行改进。该文主要对寻峰计算做了优化和改进以使SVM得到更好的效果。
1.1 峰位确定
目前存在的寻峰方法主要有一阶导数寻峰、二阶导数寻峰、对称零面积寻峰,协方差法寻峰等。
其中导数寻峰和对称零面积寻峰在寻峰之前对计数统计质量数据要求较低,不需要进行数据平滑,统计假峰及高基底的抑制能力及重峰的分辨能力来看,故而在本文采用了导数寻峰和对称零面积方法相结合的办法来实现快速峰位确定。
1.1.1 导数寻峰
导数寻峰主要是采用一阶、二阶和多阶求导,从而确定最值点,在峰位确定过程中,主要是确定其最大值点。
一阶导数寻峰:若函数[fi0]在[i0]道的一阶微商为0,即[f″i0>0,f′i0=0],[fi0]取得极值。
二阶导数寻峰:若[fi0],且[f″i0=0],当[f″i0<0]时,[fi0]为极大值,[f″i0>0]时,[fi0]为极小值。
从实际的效果上来看导数法在对单峰、强峰及弱峰的效果较好,但是在重叠峰等识别上存在问题。从灵敏度上来看:一阶寻峰的灵敏度最高,二阶次之[[2]]
2 基于SVM的核素识别方法
2.1支持向量机原理
支持向量机[2]最早由Vapnik 等人提出,是一种基于结构风险最小化原理的统计学习方法。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面,分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。最优分类超平面的构造最终归结为在原空间上求解一个凸二次规划问题。
4 结论
本方法一方面通过对峰位确定方法改进来提高特征量提取的精确度,去除[γ]能谱中重叠峰对相干核素识别中的影响,另一方面使用支持向量机方法实现核素的快速分类。通过与传统方法的比对,新方法在识别相干核素方面达到了很好的识别效果。
参考文献:
[1] 陈亮. 便携式[γ]谱仪中的核素识别算法[J].清华大学学报,2009,49(5):635-638.
[2] 刘永刚. γ能谱谱数据分解方法研究[D].北京:中国地质大学(北京)博士论文:中国地质大学,2011.
[3] 张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.
[4] CHE N Liang, WE I Yixiang. MonteCarlo simulations of the SNM spectraf or CZT and NaI spectrometers[J]. Applied Radiation and Isotopes,2008,66(8):1146-1150.
[5] 孙宗宝,孙名松.基于核主成分提取和支持向量机入侵检测[J]. 信息技术, 2007, (7): 29-31
[6] 樊卫花,王卫萍,侯胜利.低本底多道γ能谱仪解谱应用软件的开发及应用[J].岩矿测试,2006,25(1):31-34.
[7] 王增波,彭仁忠,宫兆刚 .B 样条曲线生成原理及实现[J].石河子大学学报:自然科学版,2009,27(1):119-121.
[8] 於国兵.NaI(Tl)γ能谱谱线分析技术的研究.中国辐射卫生(检测技术)[J].2009,18(4):476-478.
[9] 王季红,王良厚,孙健.基于LM 算法BP神经网络的放射性核素识别[C].绵阳:第十六届全国核电子学与核探测技术学术年会,2012:598-600.
[10] Byung-joo Kim.Il- kon Kim.Kernel Based Intrusion Detect ion System[J]. Proceedings of the Fourth Annual ACIS International Conference on Computer and Information Science. IEEE,2005:13-18.