多模式融合下的海洋溢油高光谱成像油种识别方法
2016-10-10万剑华韩仲志宋欣欣
万剑华,韩仲志,*,宋欣欣,刘 杰
(1.中国石油大学(华东) 地球科学学院,山东 青岛 266580;2.青岛农业大学 理学与信息科学学院,山东 青岛 266109;3.青岛出入境检验检疫局,山东 青岛 266001)
多模式融合下的海洋溢油高光谱成像油种识别方法
万剑华1,韩仲志1,2*,宋欣欣3,刘杰2
(1.中国石油大学(华东) 地球科学学院,山东 青岛266580;2.青岛农业大学 理学与信息科学学院,山东 青岛266109;3.青岛出入境检验检疫局,山东 青岛266001)
为利用不同油种的发光特性来探测海洋溢油,通过高光谱成像仪,在两种照明模式下采集了6种溢油油种的高光谱图像。基于33个波段构建了波段均值、波段差、波段比和归一化波段比4个辐射指数,提出了基于Fisher和PCA的模型共识的溢油高光谱特征选择方法,采用RBF-SVM模型对油种进行识别。比较发现,本文构建的基于光源混合、波段运算和模型共识的多模式融合方法,从不同侧面提高了模型的溢油识别能力,识别率达到了99.1%以上,比单一方法提高了10%以上。结果表明,多模式融合有效提高了海洋溢油的识别率。
高光谱成像;光源融合;波段指数;模型共识;油种识别
*Corresponding Author,E-mail:hanzhongzhi@qau.edu.cn
1 引 言
近年来,海洋溢油事故频发。对溢油油种进行及时准确的分析和鉴别,确定责任归属,采取合适的应急响应,是一项复杂而具挑战性的工作。现行的溢油鉴别[1],多是以液相色谱/质谱分析为代表的实验室化学鉴别手段,虽然能够对油种精确解析,但存在检测速度慢、代价高的缺点。近年来,光谱分析技术[2-3]成为溢油鉴别的新兴手段,特别是近红外光谱(NIR)技术已广泛应用于石油及其制品的组分预测中。Kim等[4]最早应用近红外光谱进行石油产品的分类,他们利用PCA和贝叶斯分类器实现了柴油、煤油、粗汽油等6个油种的识别。王丽等[5]利用近红外光谱技术鉴别模拟海面溢油,自行配制了56 个汽油、柴油、润滑油的模拟溢油样品,实现了溢油类别的正确判别。油品在紫外激发下具有荧光现象,可根据这一特性对溢油进行探测[6]。王春艳等[7]使用基于浓度参量的同步荧光光谱技术,实现了实验室条件下不同溢油类型及不同溢油源原油的准确分类。尹晓楠[8]利用小波分析方法分析了4 大类 6 种油品的三维荧光光谱,并对油品种类进行了识别研究。三维荧光技术也是现行水上溢油快速鉴别[9]的可选技术。然而,本质上,上述文献技术手段均不能做到现场、快速的原位探测。
海洋溢油往往是突发事件,通过遥感手段进行海洋溢油的快速原位探测是快速响应的重要组成部分。然而,传统的遥感手段,如星载、机载SAR等[10],只能探测溢油面积,不能区分各个油种,且受环境影响较大。由于荧光很微弱,所以国内外均开展了激光诱导荧光的探测方法[11-12],可同时实现面积和油种的探测。但该方法存在仪器笨重(200 kg)的缺点,需要搭载海监的飞机,费用太高。王晶等[13]采用主分量分析与提取波段纹理方式研究检测多光谱图像溢油区域,然而由于卫星的飞行高度及光谱分辨率只有4个波段,检测效果不佳。我们在前期的工作中利用多光谱成像技术研究了油种的识别问题,得到了较好的识别结果[14]。
鉴于高光谱成像技术更为精细的波谱刻画能力,本文针对溢油场景中的油种识别问题,通过模拟溢油环境,获取不同溢油油种高光谱图像,采用光源融合、多波段指数和模型共识等多种模式提高了识别的准确性。进而研究了复杂溢油环境下的油种识别问题。
2 实验材料
2.1实验材料
实验所用油样共6类样本:1汽油、2柴油、3煤油、4机油、5原油、6花生油。其中原油样本由山东省胜利油田海上应急中心提供,汽油和柴油油样从市场上某加油站购得,机油来自某汽车维修厂,煤油样本购自某化学品商店,花生油由某粮油供应站提供。
2.2图像获取
图像获取于2015年2月10日在中国科学院青岛光电院光谱实验室进行。在暗室环境中,首先在玻璃槽中倾倒海水,然后量取一定量的油样,布在海水表面形成一层油膜,以模拟海洋溢油。接着分别打开卤素灯和紫外灯采集溢油样本的高光谱图像。每次采集获得1 392×1 040×33的高光谱图像数据块。在两种光源下分别采集汽油、柴油、煤油、机油、花生油、原油的高光谱图像共12组。数据大小为880 Mbits。图像的分析采用Matlab2012b(Math Works,USA)完成。
图1是本实验使用的采集设备。图像获取设备为便携式成像仪,该成像仪主要由液晶可调式滤波器(Liquid crystal tunable filter,LCTF)和一台普通CCD相机组成,谱段范围为400~720 nm,光谱带宽为10 nm。光源为100 W卤素灯和一台UV 365 nm大功率LED紫外灯(美国陆阳LUYOR-3404台式紫外灯,样品处照度7 000 lm)。每个波段图像分辨率为1 392×1 040,共33个波段。不同的光源可以提供样本不同侧面的信息。通常情况下,卤素灯主要应用于反射光谱的研究,紫外灯主要用来考察样本的荧光现象。本研究同时使用两种光源,以便考察光源对识别的贡献。
图1 高光谱图像采集设备图
2.3样本预处理
配套采集软件可根据图像整体亮度情况自动调整每个波长下的曝光时间从而避免过饱和与欠饱和现象。为了使得采集光谱具有可比性,需要对采集时间归一化。需要指出,归一化会使得部分像素值过高或过低,超出0~255的范围,需要进一步调整,使其归一化到0~255之间。
图像预处理主要是对油样的有效光斑信息进行提取。为实现识别,需要构建一定数量的样本库。由于每个波段采集的图像的像素比较大,为1 392×1 040像素,先将其横纵坐标平均分为8份,这样就将图像不同位置的子图像分成64个感兴趣区域(ROI),共构建768个样本。图2(a)是原油油样在其中3个波段的灰度图像,图2(b)为两种照明方式下高光谱图像单个波段平均光谱。
图2溢油数据的图像与光谱特性。(a)灰度图像;(b)光谱特性。
Fig.2Images and spectral characteristics of oil spills data.(a) Gray images.(b) Spectral characteristics.
3 研究方法
3.1辐射指数特征的构建
从图像理解上,在卤素灯下,每个像素体现的是辐射亮度;对于紫外图像,主要体现的是荧光亮度,图像量化以后可称为图像的像素灰度值。
假设在第k个波段,坐标点(x,y)处像素的辐射亮度值定义为Ik(x,y),那么单个波段的平均辐射指数(Radiation index,RI)定义为:
(1)
这里k=1,2,…,33。由此,通过相邻波段运算,提出了3种辐射指数:
(1) 相邻波段差辐射指数(Difference radiation index,DRI):
(2)
(2) 相邻波段比辐射指数(Ratio radiation index,RRI):
(3)归一化波段差辐射指数(Normalized difference radiation index,NDRI)
(4)
这里式(2)~(4)中k=1,2,…,32,ARIk对应第k个波段像素灰度Ik(x,y)的均值(求和后除以像素数,x×y)。公式(1)~(4)描述的特征向量对应于每个波长只有一个值,较每个波段的像素数大幅度降低了数据量。
为了对特征数据有一个直观的印象,图3给出了33个单波段平均辐射指数与32个相邻波段差、波段比和归一化波段差辐射指数的盒图。可以明显看出,经过相邻波段运算后,辐射值具有了更大的变异性和可区分性。
3.2模型共识的特征选择方法
模型共识的思想就是充分发挥各个模型的优势,相互取长补短,通过融合,最终达到高效的分类目的。特征选择的目的是从原始数据(本文是像素灰度值)寻找一个特征子集来描述,通过较小的特征子集来描述图像立方体的主要信息。在高光谱分析中是找到有效的特征波长,用较少的波段代替所有波段信息。特征提取的目的是寻找特征波段的映射特征,映射特征的数量要少于原有特征的数量,从而达到了数据降维的目的。
图3 4个辐射指数特征的盒图。(a) RI;(b) DRI;(c) RRI;(d) NDRI。
Fisher特征选择法是经典的特征选择方法,它可根据鉴别力对特征进行排序,进而选取对识别起关键作用的有效波长子集。主分量分析(Principal component analysis,PCA)是广泛应用的一种优化方法[15],通过主分量贡献率和累积贡献率寻找一种高维空间的低维映射。对特征进行主成分变换,主成分权重系数对应特征的选择能力。
由于紫外和卤素两种照明方式可提供有差别的油种可区分信息,我们提出了基于Fisher与PCA光源融合下的模型共识特征选择方法,其主要思想如下:根据Fisher在可见与紫外下获取鉴别力的不同,首先通过波段鉴别力分别选可见和紫外下的特征波长各12个,共24个波长组成波段子集。然后,对这24个波段使用PCA的前5个主分量的对应波段权重系数(此时主分量累积贡献率达到了95%以上)去调整各个选择波段的权重系数,共得到加权后的波段子集24个。加权后的波段子集作为PCA的输入进行特征优化,得到12个主分量特征。这样就充分利用了波段选择与组合优化的各自优势,并充分挖掘了不同光源下的光谱信息,理论上能够提高识别特征选择的能力。
3.3研究思路
通过构建模型共识方法,本文的研究步骤为:第一步:制样。在两种光源下进行高光谱图像采集,然后进行光谱图像的预处理,包括对图像矫正和对感兴趣区域(ROI)的提取。第二步:构建4个辐射指数作为高光谱图像的特征集。第三步:进行特征的提取与优化。为验证本文方法的有效性,同时比较了通过单独使用增L减1(pulsLr1)、多维尺度分析(Multi-dimensional scaling,MDS)、独立分量分析(Independent component analysis,ICA)[16]及单独使用Fisher、PCA方法的特征选择效果。第四步:进行溢油油种的分类识别,采用识别率(CRR)进行精度评价。分类器方面,主要使用的是支持向量机模型。
图4 研究思路与共识模型方法
支持向量机(Support vector machine,SVM) 是Corinna Cortes和Vapnik等首先提出的[17],它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。SVM的关键在于核函数。低维空间向量集通常难于划分,解决的方法是将它们映射到高维空间。但这个办法带来的困难就是计算复杂度的增加,而核函数正好巧妙地解决了这个问题,这里选择RBF核函数。
4 结果与分析
实验结果是基于两种照明方式(卤素灯和紫外灯)下6种油样的33个波长的高光谱图像立方体(1 392×1 040×33)得到的。
通过公式(1)~(4)分别获得了原始波段的33个单个波长下的平均辐射指数特征33个,以及相邻波段的波段差、波段比和归一化波段差3种辐射指数的各32个特征向量,共构建了4个特征集。所有特征在特征选择优化之前将首先进行数据标准化,这样可以避免每个特征定义的衡量标准不同而影响到模型识别的差异。
图5(a)为紫外和卤素灯下Fisher单波长鉴别力和前5个主分量权重系数,可明显看到不同波段鉴别力的差别。
图5 Fisher鉴别力(a)与PCA权重系数(b)
Fig.5Fisher discriminability (a) and weight coefficient of PCA (b)
为进一步验证本文提出的基于光源特征融合的波段特征选择方法,我们比较了2种特征选择方法和3种特征优化方法,分别是增l减r法(pluslr1)、Fisher法、多维尺度分析(MDS)、主分量分析(PCA)和核独立分量分析(Kernel independent component analysis,KICA)。为了获得公平的比较效果,我们将特征选择和优化的数量设为12个,统一使用基于网格寻优的RBF-支持向量机。本文采用识别率(Correct recognition rate,CRR)来衡量算法的性能和效率。
表1 识别性能汇总表
表1是各种特征选择方法在不同的特征集情况下的识别率总表。黑色字体表示在本类特征集识别中最佳的识别率,上面是训练集识别率,下面是测试集识别率。从表1可以看出,本文提出的特征选择方法总体上表现优秀。尽管有PCA、ICA 2种情况的识别率比较高,但因其泛化能力差,所以不可选。在2种照明方式下,本文构建的3种波段运算辐射指数(DRI,RRI,NDRI)均在一定程度上表现出了比波段辐射值(RI)更佳的分类能力。其中波段差指数DRI最好,波段比指数RRI居中,归一化波段比NDRI最差。另外,紫外光源可有效提高分类器的识别能力,紫外模式对溢油种类的识别能力提高明显。
5 讨 论
分类器的识别效果严重依赖于特征提取的好坏。在理想情况下,特征向量应该是我们期望识别问题的紧致描述。我们的问题是正确识别溢油的种类,因此提取有意义和辨识力的特征是一个直接需要,这需要仔细观察油样本身所反映出的物理现象并需要专业的知识。K-折交叉验证法(K-fold cross validation)是广泛采用的模型验证方法。在机器学习领域,K往往选择5或者10。本文采用的是5折交叉验证,将实验样本随机分为5组,其中4组用来训练,余下的1组用来测试。由于实验样本有限,我们想充分利用所有样本,利用留一法(LOO-CV)重复5次进行验证。最后的识别为5次平均。
进行特征提取的目的是降低维数灾难。将特征降维到合理的范围不仅可以提高分类器的性能,还能提高识别速度,进而有助于理解问题背后的机理。对特征波段的选择目前已有多种方法[18],如分段主分量分析[15]用来检测溢油荧光,蛙跳算法[19]用来检测生物柴油等。另外,刘红玉等[20]利用高光谱图像数据进行了番茄氮磷钾营
养水平的诊断,采用遗传算法优选4个敏感波段。
形状特征对油种识别来说可能并不是好特征,因为油样分布均匀后就失去了形状信息。有溢油发生时,溢油区域和非溢油区域的局部纹理特征会发生变化[13]。这些纹理特征也被有效应用到农产品的识别上。艾诗荣等[21]利用第一主成分分析3个最大权重系数,从高光谱数据块中选取了3个特征波长,并提取了各个特征波长下灰度图像的6个纹理特征,利用BP神经网络进行了茶叶产地的识别。
鉴于本文是在实验室情况下进行的模拟溢油水槽实验,并没有考虑到风浪在水面上引起的纹理差别,所以这一特征并没有考虑。如果用于真实环境下的溢油探测,纹理特征可能是有效的模式可分性特征。然而由于真实溢油事件发生的偶然性,本文通过水槽实验模拟海洋溢油环境对关键基础问题的研究也具有一定的代表性。
多光谱技术由于结构简单、价格低廉而广泛应用于实时在线探测中。作者曾做过这方面的研究[14],但由于多光谱探测只用少数几个波段进行油品鉴别,光谱刻画能力不足,导致总体识别率不高,只有80%左右。而本文使用高光谱探测技术,将油品的识别率提高到了95%以上,文中指出并比较了高光谱探测和多光谱探测的优缺点,业务化应用过程中可根据需要进行选择。
6 结 论
基于溢油的紫外荧光特性,提出了一种在两种光源照明方式下,基于波段运算辐射指数的模型共识特征选择方法。通过Fisher与主分量分析的波段权值调整,进行了识别模型特征集合的构建。针对模拟溢油环境下的高光谱成像的油种识别问题,设计了适应性实验。研究发现:本文构建的方法在整体上对油种的识别率可达到99%以上,并具有一定的特征稳定性,较其他方法的识别率平均提高了10%。基于波段运算的辐射指数特征对油种识别具有较好的可分性,同时多种光源的照明为油种识别提供了更丰富的特征,特别是对夜间溢油环境下的油种探测具有应用价值。本文构建的方法对海洋溢油的油种快速识别具有积极意义。
[1]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.GB/T 21247-2007 海面溢油鉴别系统规范 [S].北京:中国标准出版社,2008.
General Administration of Quality Supervision,Inspection and Quarantine of the People’s Republic of China,China National Standardization Management Committee.GB/T 21247-2007 Specifications for Identification System of Spilled Oils on The Sea [S].Beijing:China Standard Press,2008.(in Chinese)
[2]HAHN S,YOON G.Identification of pure component spectra by independent component analysis in glucose prediction based on mid-infrared spectroscopy [J].Appl.Opt.,2006,45(32):8374-8380.
[3]WANG G Q,SUN Y A,DING Q Z,et al..Estimation of source spectra profiles and simultaneous determination of poly component in mixtures from ultraviolet spectra data using kernel independent component analysis and support vector regression [J].Anal.Chim.Acta,2007,594(1):101-106.
[4]KIM M,LEE Y H,HAN C H.Real-time classification of petroleum products using near-infrared spectra [J].Comput.Chem.Eng.,2000,24(2-7):513-517.
[5]王丽,卓林,何鹰,等.近红外光谱技术鉴别海面溢油 [J].光谱学与光谱分析,2004,24(12):1537-1539.
WANG L,ZHUO L,HE Y,et al..Oil spill identification by near-infrared spectroscopy [J].Spectrosc.Spect.Anal.,2004,24(12):1537-1539.(in Chinese)
[6]KESSLER J D,VALENTINE D L,REDMOND M C,et al..A persistent oxygen anomaly reveals the fate of spilled methane in the deep Gulf of Mexico [J].Science,2011,331(6015):312-315.
[7]王春艳,史晓凤,李文东,等.基于主成分和支持向量机浓度参量同步荧光光谱油种鉴别 [J].分析测试学报,2014,33(3):289-295.
WANG C Y,SHI X F,LI W D,et al..Concentration dependent synchronous fluorescence oil spill fingerprinting identification based on principal component analysis and support vector machine [J].J.Instrum.Anal.,2014,33(3):289-295.(in Chinese)
[8]尹晓楠.基于三维荧光光谱和小波分析的油品种类识别技术研究 [D].青岛:中国海洋大学,2012.
YIN X N.Studies on The Identification of Oil Types Base on 3D Fluorescence Spectroscopy and Wavelet Analysis [D].Qingdao:Ocean University of China,2012.(in Chinese)
[9]中华人民共和国交通运输部.JT/T 862-2013 水上溢油快速鉴别规程 [S].北京:人民交通出版社,2013.
Ministry of Communications of the People’s Republic of China.JT/T 862-2013 Oil Spill Identification Rules [S].Beijing:China Communications Press,2013.(in Chinese)
[10]RAMSEY Ⅲ E,RANGOONWALA A,SUZUOKI Y,et al..Oil detection in a coastal marsh with polarimetric synthetic aperture radar (SAR) [J].Remote Sens.,2011,3(12):2630-2662.
[11]赵朝方,李晓龙,马佑军.多通道海洋荧光激光雷达溢油监测系统 [J].红外与激光工程,2011,40(7):1263-1269.
LI C F,LI X L,MA Y J.Multi-channel ocean fluorescence lidar system for oil spill monitoring [J].Infrared Laser Eng.,2011,40(7):1263-1269.(in Chinese)
[12]JHA M N.Development of laser fluorosensor data processing system and GIS tools for oil spill response [EB/OL].[2015-04-12].http://www.geomatics.ucalgary.ca/research/publications.
[13]王晶,刘湘南.引入纹理特征的多光谱遥感影像海面油膜信息提取 [J].海洋通报,2013,32(4):452-459.
WANG J,LIU X N.Oil spill information extraction based on textural features and multispectral image [J].Mar.Sci.Bull.,2013,32(4):452-459.(in Chinese)
[14]韩仲志,万剑华,刘杰,等.利用油品的紫外荧光特性的多光谱成像检测 [J].发光学报,2015,36(11):1335-1341.
HAN Z Z,WAN J H,LIU J,et al..Multispectral imaging detection using the ultraviolet fluorescence characteristics of oil [J].Chin.J.Lumin.,2015,36(11):1335-1341.(in Chinese)
[15]刘智深,丁宁,赵朝方,等.主成分分析法在油荧光光谱波段选择中的应用 [J].地理空间信息,2009,7(3):12-15.
LIU Z S,DING N,ZHAO C F,et al..Application of the PCA method to band selection for oil fluorescence spectrums [J].Geospat.Inform.,2009,7(3):12-15.(in Chinese)
[16]BACH F R,JORDAN M I.Kernel independent component analysis [J].J.Mach.Learn.Res.,2003,3:1-48.
[17]CHANG C C,LIN C J.LIBSVM:a library for support vector machines [EB/OL].(2011-9-30)[2015-04-12].http://www.csie.ntu.edu.tw/-cjlin/libsvm.
[18]DU B,ZHANG L P.Random-selection-based anomaly detector for hyperspectral imagery [J].IEEE Trans.Geosci.Remote Sens.,2011,49(5):1578-1589.
[19]陈立旦,赵艳茹.可见-近红外光谱联合随机蛙跳算法检测生物柴油含水量 [J].农业工程学报,2014,30(8):168-173.
CHEN L D,ZHAO Y R.Measurement of water content in biodiesel using visible and near infrared spectroscopy combined with Random-Frog algorithm [J].Trans.Chin.Soc.Agric.Eng.,2014,30(8):168-173.(in Chinese)
[20]刘红玉,毛罕平,朱文静,等.基于高光谱的番茄氮磷钾营养水平快速诊断 [J].农业工程学报,2015,31(S1):212-220.
LIU H Y,MAO H P,ZHU W J,et al..Rapid diagnosis of tomato N-P-K nutrition level based on hyperspectral technology [J].Trans.Chin.Soc.Agric.Eng.,2015,31(S1):212-220.(in Chinese)
[21]艾施荣,吴瑞梅,吴彦红,等.利用高光谱图像技术鉴别庐山云雾茶产地 [J].江西农业大学学报,2014,36(2):428-433.
AI S R,WU R M,WU Y H,et al..Identification of geographical origins of Lushan mist tea by hyper-spectral imaging technology [J].Acta Agric.Univ.Jiangxiensis,2014,36(2):428-433.(in Chinese)
万剑华(1963-),男,山东单县人,教授,博士生导师,2001年于武汉大学获得博士学位,主要从事石油分析与探测方面的研究。
E-mail:wjh66310@163.com
韩仲志(1981-),男,山东莒南人,副教授,博士研究生,2006年于广西师范大学获得硕士学位,主要从事光学探测方面的研究。
E-mail:hanzhongzhi@qau.edu.cn
Oil Spills Identification Using Hyperspectral Imaging Based on Multi-pattern Method
WAN Jian-hua1,HAN Zhong-zhi1,2*,SONG Xin-xin3,LIU Jie2
(1.School of Geosciences,China University of Petroleum,Qingdao 266580,China;2.Information College,Qingdao Agricultural University,Qingdao 266109,China;3.Qingdao Entry-exit Inspection and Quarantine Bureau,Qingdao 266001,China)
In order to identity different oil spill by the fluorescence phenomena of oil and its products,the hyperspectral images data of six varieties of oil spills samples were collected under two kind of illuminations (UV and halogen lights) using hyperspectral imaging camera.In the spectral region of 400-720 nm (10 nm spectral bandwidth),four radiation index were obtained which include radiation index of individual spectral bands and the difference,ratio,and the normalized difference radiation index of consecutive spectral bands.Then,a novel method composed of Fisher and PCA to identify most significant wavelengths was proposed,and a classified model based on REF-SVM and the proposed method was established.By comparison,it is found that the different radiation index,light fusions and model consensus of feather selected method all can improve the accuracy of recognition rate.The overall accuracy rate by our method is above 99.1%,which is obviously higher than traditional methods only use one method.The experiment results show that the multi-pattern fusion can effectively improve the recognition rate of marine oil spill.
hyper-spectral imaging; light fusions; band index; model consensus; oil identification.
1000-7032(2016)04-0473-08
2015-11-17;
2015-12-29
国家自然科学基金(31201133);青岛市科技发展计划(14-2-3-52-nsh)资助项目
O439
A
10.3788/fgxb20163704.0473