高光谱遥感影像分类算法并行处理设计与实现
2016-02-23秦飞龙柳炳利周仲礼程宾洋
秦飞龙, 郭 科, 柳炳利, 周仲礼, 程宾洋, 武 进
(成都理工大学 数学地质四川省重点实验室,成都 610059)
高光谱遥感影像分类算法并行处理设计与实现
秦飞龙, 郭科, 柳炳利, 周仲礼, 程宾洋, 武进
(成都理工大学 数学地质四川省重点实验室,成都 610059)
[摘要]探讨高光谱遥感影像分类算法处理遥感影像速度。通过光谱角度匹配(SAM)、光谱相关系数匹配(SCM)、信息散度匹配(SIDM)、光谱波形匹配(SWM)进行并行化改造设计,将改造的并行化算法应用到湖北大冶遥感影像数据分类处理中,结果表明并行化算法能够有效完成高光谱遥感影像分类,数据量增大,并行化处理速度加快,数据量为158×382×1 092时,SAM并行处理速度是串行处理速度的25.68倍、SCM为25.41倍、SIDM为17.55 倍、SWM为23.68倍。并行分类算法处理遥感影像分类速度较串行分类算法处理快。
[关键词]并行设计;高光谱影像;分类算法
高光谱遥感图像对人类社会带来了大量空间影像数据相关信息,在地质、气候、环境、军事、农业等领域起着广泛应用。高光谱处理技术最关键环节就是给高光谱数据分类处理。高光谱遥感影像矿物填图[1]是建立在遥感图像分类的基础上,结合高光谱图像自身特点,对所选区域的目标进行划分与确认的过程。不同种类的地物在遥感影像上的亮度值、像元值以及空间变化规律都不相同[2],在遥感领域中通过这些差异对遥感图像进行分类并提供地物依据。随着高光谱遥感影像空间分辨率和波谱分辨率的日益增高,高光谱遥感影像的数据量变得越来越巨大,常用的高光谱遥感影像分类算法在处理大数据高光谱影像时效果不明显,运算速度慢,这使得高光谱遥感影像分类技术在处理实际海量数据时效果不佳,从而有必要对高光谱分类算法进行改进,提高分类处理速度。高光谱遥感影像光谱具有分辨率高、遥感影像任意一个像元点的光谱特征曲线精细、波长范围宽、数据具有定量性等特点[3],对高光谱影像分类处理更不容易。然而要得到好的分类效果,必须对高光谱数据进行扩充,显然就得提高分类运算速度。因此,本文以4种常见的高光谱遥感影像分类算法为例进行并行处理,可以把遥感影像分类处理的速度提高几十倍,实现大规模的高光谱遥感影像数据分类。
1高光谱遥感影像分类算法
目前,高光谱遥感影像分类的算法[4-6]比较广泛,但分类算法大体上分为2种:一种是根据遥感图像统计特性构建分类模型进行分类;另一种是通过地物物理光学性质的不同而进行地物分类,它的主要分类依据是利用地物物理光学性质的光谱曲线来识别地物。通过地物物性的分类方法是运用最广的方法,原因是该分类算法的匹配既可全波长范围内比较,也可以是特定波段的分波长范围光谱或光谱组合参量。4种常用的高光谱矿物填图算法[光谱角度匹配(SAM)、光谱相关系数匹配(SCM)、信息散度匹配(SIDM)、光谱波形匹配(SWM)][7]就属于地物物性分类算法。
光谱角度匹配原理
(1)
光谱相关系数匹配原理
(2)
信息散度匹配原理
S(x,y)=D(x‖y)+D(y‖x)
(3)
光谱波形匹配原理
F=
(4)
2高光谱遥感影像分类算法并行设计
2.1波谱库数据重采样
大部分高光谱遥感影像分类算法要求待分类的高光谱遥感影像与波谱库数据具有相同的波段数,然而实际情况下这两种数据相同情况很少,需要对波谱库数据进行重采样。波谱库数据重采样要求波谱库数据采样的波段范围包含在待分类高光谱遥感影像的波段范围内。有研究者采用简单的线性插值的方式来完成对波谱库数据的重采样[7]。如果待分类的高光谱影像有N个波段,波谱库中有M种矿物,则将进行N×M次插值运算。由于每种矿物的插值运算是相互独立的,所以本文采用的并行策略是在GPU中产生M个线程,每个线程负责一种矿物的光谱重采样。
2.2分类算法的并行策略设计
由分类算法表达式(1)、(2)、(3)和(4)知待分类的高光谱遥感影像中各个像元点与波谱库矿物的计算是相互独立的,即各像元点与波谱库中矿物的计算结果只与该像元点在各个波长段的反射率值相关,而与其他像元点的反射率值无关。4种高光谱矿物分类算法的并行计算是以高光谱遥感影像的像元为核心,分别计算每一个像元与波谱库中的各类矿物的值(SAM为夹角余弦值、SCM为两者之间的相关系数值、SIDM为两者之间的信息散度值、SWM为两者之间的拟合度),采用并行策略设计是根据待分类高光谱影像的像元点数目在GPU中产生相同的线程数目,每个线程通过计算一个像元点与波谱库中各种矿物的对应关系来对该像元进行分类。分类并行算法流程如下(图1):(1)读取待分类的高光谱遥感影像,读取参考光谱数据(经过重采样后的数据)。(2)数据初始化,完成对设备端的内存分配,将遥感数据拷贝到设备端内存。(3)调用相应的内核函数完成计算,线程数目与像元点数目相同。(4)将计算结果由设备端内存拷贝到内存。
图1 分类算法并行处理流程图Fig.1 The parallel processing flow chart ofthe classification algorithm
3并行算法对实际高光谱遥感影像分类处理
本文的光谱数据来源于《东天山的岩性光谱库数据》,包含了226种矿物在2 101个波段长度的反射率值。实验数据来自湖北大冶的一组高光谱遥感数据,数据量大小为:158×191×273、158×382×273、158×382×546、158×382×1092。高光谱遥感影像分类算法的计算机CPU型号是intel core(TM)i7,其主频为2.80 GHz,内存为4.0 G,显卡型号是NVIDIA GeForce 310M,操作系统为Windows 7 32。4种分类算法的串行和并行程序编写工作是用Microsoft visual C++ 2008+和CUDA完成的。原始遥感影像显示和分类结果显示是用IDL(interactive data language)可视化交互数据语言进行图形显示。在实验时,SAM算法设定的分类阈值为5°,SCM算法设定的分类阈值为0.95,SIDM和SWM未设定分类阈值。并行分类算法处理原始高光谱影像(图2)得到分类结果如图3。
图2 原始高光谱影像Fig.2 The original hyperspectral image
为了能够体现分类算法的并行策略优越性,体现分类算法并行化运算速度,将4种分类算法在并行设计与串行设计下进行加速比显示(图4)。加速比是指在相同的软硬件条件和数据量条件下同一种算法串行运行时间和并行运行时间之比。4种算法的加速比统计结果如表1所示。
由图3可以看出,高光谱影像分类算法并行设计处理能够完成高光谱遥感影像图像分类,通过图4和表1可以看出:并行设计算法完成遥感影像分类运算时间少、计算速度快,并行化处理的速度比串行处理的速度提高了几十倍。随着数据量的加大,加速效果也更为明显。在数据量为158×382×1092时,4种算法的加速比:SAM为25.68倍、SCM为25.41倍、SIDM为17.55倍、SWM为23.68倍。从而并行化处理能够快速完成高光谱海量数据分类。
4结 论
图3 并行分类设计处理的结果Fig.3 The processed results by the parallel classification(A)SAM分类结果; (B)SCM算法分类结果; (C)SIDM算法分类结果; (D)SWM算法分类结果
图4 4种算法加速比Fig.4 The speedups with 4 algorithms(A)SAM算法加速比; (B)SCM算法加速比; (C)SIDM算法加速比; (D)SWM算法加速比
算法数据量运行时间/ms并行串行加速比算法数据量运行时间/ms并行串行加速比SAMSCM158×191×27316.5735921.60158×382×27329.8371724.04158×382×54648.14113924.28158×382×109298.39252725.68158×191×27317.5735720.32158×382×27335.8474520.79158×382×54650.12121124.16158×382×1092105.78268825.41SIDMSWM158×191×27335.23408.6711.6158×382×27329.83964.4916.04158×382×546125.462105.216.78158×382×1092263.674627.417.55158×191×27330.12325.2910.8158×382×27362.151071.417.24158×382×546128.742482.219.28158×382×1092272.116443.623.68
本文通过高光谱遥感影像分类算法深入研,提出相同的软硬件条件和数据量条件下对同一算法分类的运算速度作出改进,得出高光谱分类算法的并行策略,将并行策略运用到实际高光谱影像数据中,结果表明并行设计方案下高光谱各分类算法能够对高光谱遥感影像数据进行分类处理,处理时间短,运算速度快,对大数据高光谱遥感影像分类处理具有重大意义。
[参考文献]
[1] Liu K, Zhang L F, Qin H H,etal. Weighted spectral unmixing method for hyperspectral mineral mapping[J]. Journal of Remote Sensing, 2013, 17(3): 609-615.
[2] 徐元进,胡光道,张献.基于穷举法的高光谱遥感图像地物识别研究[J].武汉大学学报:信息科学版,2008,33(2):124-127.
Xu Y J, Hu G D, Zhang X. Object identification for hyperspectral image based on exhaustive method[J]. Geomatics and Information Science of Wuhan University, 2008, 33(2): 124-127. (In Chinese)
[3] 宋相法,焦李成.基于稀疏表示及光谱信息的高光谱遥感图像分类[J].电子与信息学报,2012,34(2):268-272.
Sony X F, Jiao L C. Classification of hyperspectral remote sensing image based on sparse representation and spectral information[J]. Journal of Electronics & Information Technology, 2012, 34(2): 268-272. (In Chinese)
[4] 王坷,顾行发,余涛,等.基于频谱相似性的高光谱遥感图像分类方法[J].中国科学,2013,43(4):407-416.
Wang K, Gu H F, Yu T,etal. Based on the classification algorithm of the hyperspectral remote sensing image on spectral similarity[J]. Science China, 2013, 43(4): 407-416. (In Chinese)
[5] 张敬,朱献文,何宇.高光谱遥感图像分类算法中的应用研究[J].计算机仿真,2012,29(2):281-284.
Zhang J, Zhu X W, He Y. Application of hyperspectral remote sensing images classification method[J]. Computer Simulation, 2012, 29(2): 281-284. (In Chinese)
[6] Kumar A S, Keerthi V, Manjunath A S,etal. Hyperspectral image classification by a variable interval spectral average and spectral curve matching combined algorithm[J]. International Journal of Applied Earth Observation and Geoinformation, 2010, 12(4): 261-269.
[7] 程宾洋.高光谱遥感蚀变矿物填图算法并行设计与实现[D].成都:成都理工大学档案馆,2013.
Chen B Y. The Parallel Design and Implementation of Hyperspectral Remote Sensing Mineral Mapping Algorithm[D]. Chengdu: The Archive of Chengdu University of Technology, 2013. (In Chinese)
Parallel design and realization of classification algorithm of
hyperspectral remote sensing image
QIN Fei-long, GUO Ke, LIU Bing-li, ZHOU Zhong-li, CHENG Bin-yang, WU Jin
TheKeyLaboratoryofMathematicalGeologyinSichuan,
ChengduUniversityofTechnology,Chengdu610059,China
Abstract:This paper discusses the speed of the classification algorithm of hyperspectral remote sensing images. The classification algorithms of SAM, SCM, SIDM and SWM are designed by the parallel reconstruction method. The parallel reconstruction method is used to process the data of the hyperspectral remote sensing images which comes from Daye County in Hubei Province. The result shows that the parallel algorithm can effectively finish the classification of the images and the speed of the parallel processing is accelerated through increasing the amount of the image data. The parallel processing speed of SAM is 25.68 times, that of SCM is 25.41 times, that of SIDM is 17.55 times, and that of SWM is 23.68 times when the amount of data is 158×382×1092. The time of processing the remote sensing images by the parallel classification algorithm is shorter than that by the series classification algorithm.
Key words:concurrent design; hyperspectral image; classification algorithm
[文献标志码][分类号] O29: P627 A
DOI:10.3969/j.issn.1671-9727.2016.01.13
[文章编号]1671-9727(2016)01-0119-05
[收稿日期]2014-10-27。
[基金项目]2013高等学校博士学科点专项科研联合资助项目(20135122110010); 国家自然科学基金资助项目(41272363); 地质调查科技支撑计划项目(12120114002001)。
[第一作者] 秦飞龙(1983-),男,博士研究生,研究方向:地化勘探、数学地质, E-mail:lida_112@163.com。
[通信作者]柳炳利(1981-),男,博士,讲师,研究方向:地化勘探、数学地质, E-mail:22816707@qq.com。