基于压缩感知的地基红外云图云状识别

2015-07-05韩文宇高太长张孝忠

应用气象学报 2015年2期

关键词：降维识别率云图

韩文宇刘磊高太长李云胡帅张孝忠

1)(解放军理工大学气象海洋学院, 南京 211101) 2)(中国人民解放军65631部队，锦州 121017)

基于压缩感知的地基红外云图云状识别

韩文宇1)*刘磊1)高太长1)李云1)胡帅1)张孝忠2)

1)(解放军理工大学气象海洋学院, 南京 211101)2)(中国人民解放军65631部队，锦州 121017)

为了对地基全天空红外测云仪获得的云图进行分类，该文从压缩感知理论出发，提出了一种利用云图灰度稀疏性进行云状识别的新方法。首先运用典型云图样本构造冗余字典，然后通过梯度投影(GPSR)算法和正交匹配(OMP)算法求取测试样本在冗余字典中的l1范式最优解，最后利用残差法和稀疏比例法对云状进行判别并输出。采用压缩感知理论进行云状识别，降低了对特征提取技术的要求，为云状的自动识别提供了新思路，对典型波状云、层状云、积状云、卷云和晴空的总体识别率分别达到75%，91%，70%，85%和93%，平均识别率为82.8%。

红外云图；压缩感知；稀疏表示；云状识别

引言

云的形成和演变是大气中物理过程的宏观体现[1]，云的分布、形态、变化是大气动态、天气变化的重要指示。云状作为云探测的重要宏观参数之一[2]，在天气预报、现场保障、航空航天和气候研究中发挥着重要作用。相比云的天基探测技术以及基于可见光、近红外的地基云测量仪器，地基红外测云技术具有局部高时空分辨率和昼夜实时检测的优势[3-4]。利用大气向下红外辐射进行云的测量是地基云遥感的重要趋势之一[5]。红外云分析仪(ICA)[6]、红外云成像仪(ICI)[7]和全天空红外测云仪(WSIRCMS)[5]等均是对下行辐射进行测量，其中解放军理工大学研制的WSIRCMS[8]采用320×240像素的非致冷红外焦平面阵列，具有温度适应范围广和无需制冷装置的优点。

随着云的地基观测仪器不断发展，云底高度、云量测量和反演技术在日益提高[9-12]，但地基云状自动识别一直是未能有效解决的难点。主要原因在于云体本身变化多端，人工目测时一般根据云的颜色、形态、轮廓、范围以及演变过程等综合特征进行判别[2]，而计算机进行识别时，传统的特征提取方法很难对这些复杂特征进行有效描述，从而造成自动识别困难。特别是对于红外云图，云图分辨率一般较低，与可见光云图相比，没有RGB值，缺少颜色信息，所以在红外云图中提取特征更困难。

云状自动识别从实现过程上看，可以分为3个部分：云图预处理、特征提取、分类器选择。云图预处理主要包括灰度转换[13-14]、图像分割[14-15]、图像平滑[16]等，目的在于为特征提取提供统一的图像类型；特征提取是从云图或图像序列中提取能够表征云状本质的信息，在提取过程中，为了避免维数危机，可能还需要特征降维、特征分解等进一步处理；分类器选择是选择合适的分类器，分析特征间的关系，将输入的云图分到相应的类别。

目前国内外地基云图特征提取主要借鉴卫星云图手段，以纹理特征、结构特征提取为主。纹理特征主要有基于统计的方法和基于纹理基元的方法，如依据单个像素及其邻域的灰度或某种属性分布的纹理能量分析法(LAWS)[17-19]，对图像作二维快速傅里叶变换求功率谱矩阵的傅里叶频谱分析法[14,20]，反映图像中任意两点灰度相关性的灰度共生矩阵分析法及其衍生方法[21-25]，表达每个像元与周围像元相对灰度关系并作为一个纹理基元进行统计分析的局部二值模式(Local Binary Patterns，简称LBP)[26-27]和模糊纹理光谱分析法[28]等。结构特征主要包括云块灰度均值、云缝大小、云块云缝的清晰程度、云块相对大小等[16]。

分类器选择是云状自动识别的一个重要步骤，好的分类器对于识别结果有重要影响。目前国内外研究的重心主要集中于云图特征的提取而忽略了分类器的选择，其中使用最多的是K均值聚类(K-Nearest-Neighbor，简称KNN)[14,29]，另外， Calb等[13]和Liu等[16]也运用了一种基于二维六面体技术的判别分类器，其他的线性分类器[16]和二元决策树[19]也曾被使用。需要说明的是，传统的云状识别率较低，主要有两个方面原因：特征提取的数量和相关性均对识别率有较大影响，找到一系列彼此干扰小、数量适中的特征是一个非常繁琐和复杂的过程；传统的分类器一般均不具备非线性判别能力。

总的来说，对地基云状的自动识别，已经做了很多工作，且通过图像特征提取进行分类。红外云图一般维数较高，云图灰度值为红外下行辐射值反演得到，层次不够明显，本文尝试在云状的识别中引入压缩感知理论[29-32]，避开寻求将高维云图映射为低维特征空间的特征提取方法，即利用测试样本与样本库之间的稀疏性，通过求取稀疏解进行分类。

1 云图的稀疏表示

设N个样本分别属于I类云，根据压缩感知理论[33-35]，若I类云样本充足，则对于任意一个属于此I类云的任意测试样本Y，可以用冗余字典Φ=[Ii，1，Ii，2，…，Ii，n]∈KM×N线性表示，即

Y=si，1Ii，1+si，2Ii，2+……+si，nIi，n，

(1)

其中，si，n是线性组合的尺度因子。对于冗余字典A=[I1，I2，…，Ik]而言，测试样本可表示为

Y=AS∈Kn，

(2)

其中，S=[0，…，0，si，1，si，1，……，si，1，0，……，0]T∈Kn，i为测试样本Y的分类，K表示分维空间。

在实际分类中，由于噪声和计算误差的存在，S中的非零项可能出现在其他类别位置，因此，在求解式(2)时，须放宽条件，转化为

S1=argmin‖S‖1,

(3)

其中，ε是噪声上界,S限定于‖AS-Y‖≤ε。式(3)即统计学上的LASSO问题[36]，求解形式为

(4)

2 基于压缩感知的云状识别

本次试验选用解放军理工大学自主研制的WSIRCMS所得云图，为了避免单一地区对试验的影响，使试验结果更加具有普适性，从北京、南京、阳江2011年11月1日—2012年6月31日1782张样本中抽取250张典型样本作为样本库，随机抽取250张作为测试样本，总计波状云、层状云、积状云、卷云、晴空各100张，云图大小为320×240。样本见图1。

首先建立冗余字典。为了减少运算复杂度和运算时间，用主成分分析(Principal Component Analysis，简称PCA)和下采样对所有样本进行降维。PCA借助一个正交变换R，将样本库列叠加形成的原始矩阵A(76800×250)从高维空间投影到低维空间中，形成冗余字典A*(249×250)，测试样本进行同样的正交变换，形成Y(249×1)，对于降维后的矩阵选取的贡献率，即选取列的个数，接下来会进行讨论。对于下采样降维，将所有样本图像转化为320/

图1 样本云图 (a)波状云，(b)层状云，(c)积状云，(d)卷云，(e)晴空Fig.1 Sample of cloud images (a)waveform cloud，(b)stratiform cloud，(c)cumuliform cloud，(d)cirrus,(e)clear sky

S2=argmin‖S‖1,

(5)

其中，R*表示降维算子,S限定于‖R*AS-Y‖≤ε。式(5)的求解形式为

(6)

其次，求解l1范式最优解，本次试验选用梯度投影(GPSR)算法[37]和正交匹配(OMP)算法[38]，这两种算法也是稀疏求解中常用的算法。

最后，对于求得的稀疏最优解，分别采用残差法和稀疏比例法进行云状判别研究。残差法是目前压缩感知识别模式中使用较为普遍的判别方式，代表了测试样本与重构样本之间的差异度，其表达式为e=‖Y-ASi‖2，i=1,2,…,5,残差最小的是测试样本的类别。稀疏比例法是根据稀疏解分布特征提出的一种判别方式，其表达式为q=∑abs(|Si|)/ ∑abs(|S|),i=1,2,…,5，表示i类的稀疏解绝对值在整个解中所占的比例，比例最大为其分类。其中，Si=[0,……,0,αi,1,αi,1,……,αi,1,0,……,0]T∈Kn，表示稀疏解中只有与i类训练样本对应的元素同乘1，其余元素同乘0。

总体流程见图2。

图2 基于稀疏表示的云状识别流程Fig.2 The process of cloud classification based on sparse representation

3 试验结果

3.1 降维方法

降维处理对于稀疏求解十分重要，可以降低运算复杂度、节省运算时间，实时判断云状有重要意义。本文选用的PCA和下采样两种降维方式，经过多次试验发现，对于1倍、4倍、9倍、16倍、25倍、36倍下采样机制，其中16倍下采样降维运算时间和稳定能够达到最优效果。平均识别运算时间随倍数增大而减小，降维倍数超过16时识别率急剧减小；PCA降维时，当特征维数大于93，其贡献率已超过95%，整体识别率与16倍下采样基本持平，运算时间小于16倍下采样降维。本文分析一律采用简洁直观的特征维数为95的PCA降维。GPSR算法的PCA具体综合识别率见图3。

图3 PCA降维总体识别率Fig.3 Overall recognition rate by PCA

3.2 算法分析

观察不同算法得到的稀疏解分布(图4)，发现GPSR稀疏解、OMP稀疏解分布在其他类别区域依然存在。究其原因，在建立冗余字典时，不同类型样本之间不相关性不能得到保证，即样本之间存在相关性，特别是在云图一维化后，这种相关性会加大；另外，相对云体的千变万化，选用的云图所包含的云体比例、云状形状等只是很少一部分，即冗余字典不完备；在对冗余字典进行一维化处理时，云图中所包含的云体结构、纹理特征进一步弱化，而如何在这一过程中保留这些特征是下一步需要解决的问题。对于OMP稀疏解在其他区域偶尔出现的极大值，如波状云，其主要原因一部分是云图本身的相关性，一部分是OMP算法的不稳定[39]。

图4 不同云状的GPSR和OMP稀疏解分布Fig.4 Sparse solution distribution of different cloud classification

续图4

对于GPSR算法所得稀疏解，其总体分布较OMP算法分散，但结果较为稳定，极大值与所属类型的稀疏解相对差异较小，主要因为GPSR算法对冗余字典处理过程中产生的噪声有一定抑制作用。

GPSR稀疏解和OMP稀疏解在类别外云状均存在(图4)。这是因为选用的冗余字典不是完全正交和完备的，积状云云图一维化处理时，其矩阵中包含较多有云和无云的界限，在数据中表现为灰度值差异大，这一特性在以纯云图数据构成的冗余字典中尤为明显；同时，稀疏解相对较小主要是因为这种数据的结构特性在整个冗余字典庞大的数据中只是较少的一部分，并不能完全决定云状分类。

3.3 判别方法

从不同的判别方法识别结果(表1)可以看出，在GPSR和OMP算法中，积状云的稀疏比例法识别率要明显高于残差法，其平均识别率达到73%。卷云的OMP算法识别率要高于GPSR算法，平均识别率达到81%，特别是OMP算法结合稀疏比例法识别率达到88%。层状云、晴空两种判别方法的识别率比较稳定，其总体识别率分别为92.5%，94.5%。对于波状云，两种识别算法结果均不理想。

表1 残差法和稀疏比例法的识别率(单位：%)Table 1 Recognition rate by residual and sparse-proportion methods(unit:%)

对于波状云识别率不高，以 GPSR算法为例，分析其分类混淆矩阵(表2、表3)、稀疏解分布图(图4)、波状云残差、稀疏比例序列(图5)发现：波状云得到的稀疏解很大一部分为负值，在负值比例超过其归属类型稀疏解的46%时，利用e=‖Y-ASi‖2，i=1，2，…，5计算残差，得到的值一般大于层状云和卷云的残差，经过多次试验发现，在这种情况下应用e=‖Y+ASi‖2，i=1，2，…，5计算残差能够正确分类，但在本次试验中，积状云稀疏解负值很多时候同样大于46%，所以在没有先验条件的情况下，很难有效选择残差计算方式。另外，在求稀疏解时，尽量避免负值的出现，也是下一步需要改进的地方。稀疏比例法识别为积状云的波状云稀疏比例总是仅次于积状云，其残差一般较积状云小；残差法识别为层状云、卷云的波状云，其属于层状云、卷云的稀疏比例较小。经过多次试验，发现两种判别方法结合使用对于波状云、积状云、卷云的识别率都有不同程度提高，即首先选取稀疏比例大的前两项类别，再对这两类进行残差分析，最终根据这两类的残差进行分类，总体平均识别率达到82.8%。其结合识别率如表4所示。

表2 GPSR算法和残差法的具体分类混淆矩阵Table 2 Classification of confusion matrix by GPSR and residual methods

表3 GPSR算法和稀疏比例法的具体分类混淆矩阵Table 3 Classification of confusion matrix by GPSR and sparse-proportion methods

表4 残差法与稀疏比例法相结合的识别率(单位：%)Table 4 Recognition rate by residual with sparse-proportion method(unit:%)

图5 波状云残差、稀疏比例序列图Fig.5 Residual and sparse-proportion of wave cloud

综合上述分析，GPSR算法重构精度高，所得残差总体较OMP算法小，但计算复杂度较高，运算时间较OMP算法长。OMP算法虽然重构性能略差，但具有很低的运算复杂度，且比较适合于样本相关性较高的情形，这也是OMP算法的整体识别率高于GPSR算法的主要原因；而在利用典型样本构建样本库时，由于云体的多变性，不同云状的云图不可避免地会有一定相关性存在，所以OMP算法更为适合。对于判别方式，两种判别方式结合使用对于云状识别率有很大改善。

4 小结

本文在云状自动识别中引入压缩感知理论，利用典型云图样本建立的样本库和测试云图样本之间存在的稀疏性，通过范式求解所得稀疏解判断云图的归类，并进行初步试验，结论如下：

1) PCA和下采样两种降维方式的最佳降维方式对结果影响不大，特征维数大于95%的识别率与16倍下采样的识别结果基本持平，所以考虑到运算时间认为PCA降维方法更为实用。

2) GPSR算法对积状云的识别结果优于OMP算法，对卷云的识别结果劣于OMP算法，其主要原因是GPSR算法对云图数据的灰度差异，即对云与天空的界限比较敏感，换言之，GPSR算法对样本间的相关性有较高的要求。

3) 结合地基红外云图的特点改进判别方式，利用残差法与稀疏比例法进行结合的方式使波状云和积状云的识别率有了很大提高。

然而，在实际运用中还存在一些问题，如地基云图在降维过程和云图一维化过程中，如何保留云体的结构特征和纹理特征，如何在求取稀疏解的过程中减少负值的出现，如何在确保样本库正交性和完备性的同时，保证样本之间的不相关性以及如何选择样本库的大小和典型样本，并将其中的规律量化，是下一步工作中需要解决的问题。

致谢：本文采用美国科罗拉多大学Stephen Becker教授编写的OMP程序，葡萄牙里斯本大学Mario A T Figueiredo教授编写的GPSR程序，稍作改动，在此表示感谢。

[1] 刘瑞霞，刘玉浩.中国云气候特征的分析.应用气象学报,2004,15(4):465-474.

[2] 林晔.大气探测学教程.北京:气象出版社，1993:20-21.

[3] 陆雅君，陈刚毅，龚克坚，等.测云方法研究进展.气象科技，2012,40(5):689-697.

[4] 高太长，刘磊，赵世军，等.全天空测云技术现状及进展.应用气象学报,2010,21(1):101-109.

[5] 孙学金，高太长，翟东力,等.基于非制冷红外焦平面阵列的全天空红外测云系统.红外与激光工程，2008，37(5):761-764.

[6] Genkova I，Long C N，Besnard T，et al.Assessing Cloud Spatial and Vertical Distribution with Infrared Cloud Analyzer.Fourteenth ARM Science Team Meeting Proceedings，2004.

[7] Shaw J A，Nugent P，Pust N J, et al.Radiometric cloud imaging with an uncooled microbolometer thermal infrared camera.OpticsExpress，2005,13(15):5807-5817.

[8] 孙学金，刘剑，毛节泰.全天空红外测云系统辐射传感器的替代定标.红外与毫米波学报，2009，28(1):53-57.

[9] Allmen M C，Kegelmeyer W P.The computation of cloud-base height from paired whole-sky imaging cameras.AtmosOceanicTechnol，1996,13:97-113.

[10] Seiz G，Baltsavias E P，Gruen A.Cloud mapping from the ground:Use of photogrammetric methods.PhotogrammEngineeringRemoteSensing，2002,68:941-951.

[11] Kassianov E，Long C N，Christy J.Cloud-base-height estimation from paired ground-based hemispherical observations.JApplMeteor，2005，44:1221-1233.

[12] 胡树贞，马舒庆，陶法，等.地基双波段测云系统及其对比试验.应用气象学报，2012,23(4):441-450.

[13] Calbó J，Sabburg J.Feature extraction from whole-sky gro- und-based images for cloud-type recognition.JAtmosOceanicTechnol，2008,25:3-14.

[14] Heinle A，Macke A，Srivastav A.Automatic cloud classification of whole sky images.AtmosphericMeasurementTechnique，2010,3:557-567.

[15] 师春香，吴蓉璋，项续康.多阈值和神经网络卫星云图云系自动分割试验.应用气象学报，2001，12(1):70-78.

[16] Liu L，Sun X J，Chen F，et al.Cloud classification based on structure features of infrared images.JAtmosOceanicTechnol，2011,28:410-417.

[17] Singh M，Glennen M.Automated ground-based cloud recognition.PatternAnalAppl，2005，8:258-271.

[18] Sonka M，Hlavac V，Boyle R.Image Processing，Analysis and Machine Vision (Second Edition).北京:人民邮电出版社，2002.

[19] Buch K A，Jr Sun C H.Cloud Classifation Using Whole-Sky Imager Data∥Proceedings of the Ninth Symposium on Meteorological Observations and Instrumentation.Charlotte，North Carolina,1995:353-358.

[20] Singh M，Glennen M.Automated ground-based cloud recognition.PatternAnalApplic,2005,8:258-271.

[21] Augusteijn M F.Performance evaluation of texture measures for ground cover identification in satellite images by means of a neural-network classifier.IEEETransGeoSsciRemoteSensing，1995,33(3):616-626.

[22] Lohmann G.Co-Occurrence-Based Analysis and Synthesis of Textures，Pattern Recognition.Conference A:Computer Vision &Image Processing，Proceedings of the 12th IAPR International Conference on Volume:1.1994:449-453.

[23] Haralick R M，Dinstein I，Shanmugam K.Textural features for image classification.IEEETransSystManCybern，1973,3:610-621.

[24] Welch R M，Kuo K S，Sengupta S K.et al.Cloud field classification based upon high spatial resolution textural feature (I):Gray-level cooccurrence matrixa approach.JGeophysRes，1988,93:12663-12681.

[25] Kuo K S，Welch R M，Sengupta S K.Structural and textural characteristics of cirrus clouds observed using high spatial resolution landsat imagery.JApplMeteorol，1988,27(11):1242-1260.

[26] 孙学金，刘磊，高太长，等.基于LBP算法的全天空红外云图的分类研究.大气科学学报，2009，32(4):490-497.

[27] 孙学金，陈峰，刘磊，等.阈值与纹理相结合的云识别方法.解放军理工大学学报:自然科学版，2011，12(4):397-402.

[28] 孙学金，刘磊，高太长，等.基于模糊纹理光谱的全天空红外图像云分类.应用气象学报，2009，20(2):157-163.

[29] 朱彪，杨俊，吕伟涛，等.基于KNN的地基可见光云图分类方法.应用气象学报，2012,23(6):721-728.

[30] 皱伟，李元祥，杨俊杰，等.基于压缩感知的人脸识别方法.计算机工程，2012，38(24):133-136.

[31] Wright J，Yang Y，Ganesh A，et a1.Robust face recognition via sparse representation.PatternAnalysisandMachineIntelligence，2009,31(2):210-227.

[32] 蔡将飞，张明，朱俊平.基于压缩感知理论的杂草种子分类识别.中国科学:信息科学，2010，40(增刊Ⅰ):160-172.

[33] Candes E J，Romberg J.Quantitative robust uncertainty principles and optimally sparse decompositions.FoundComputerMath，2006,6:227-254.

[34] Candes E J.Compressive Sampling∥Leon M,Andratas C，Casacuberta C，et al.Proceedings of The International Congress of Mathematicians.Madrid:European Mathematical Society Publishing House，2006:1433-1452.

[35] Candes E J，Romberg J，Tao T.Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information.IEEETransInformTheory，2006，52:489-509.

[36] Tibshirani R.Regression shrinkage and selection via the LASSO.JRoyStatSocB，1996，58:267-288.

[37] Figueiredo M A T，Nowak R D，Wright S J.Gradient projection for sparse reconstruction:Application to compressed sensing and other inverse problems.IEEEJournalofSelectedTopicsinSignalProcessing，2007，1(4):586-597.

[38] Tropp J A.Greed is good:Algorithmic results for sparse approximation.IEEETransOnInformationTheory，2004，50(10):2231-2242.

[39] 殷爱菡，姜辉明，张清淼.改进OMP算法在人脸识别中的应用.计算机工程，2012，38(12):146-148.

Classification of Whole Sky Infrared Cloud Image Using Compressive Sensing

Han Wenyu1)Liu Lei1)Gao Taichang1)Li Yun1)Hu Shuai1)Zhang Xiaozhong2)

1)(CollegeofMeteorologyandOceanography,PLAUST,Nanjing211101)2)(UnitNo.65631ofPLA,Jinzhou121017)

Cloud type, as an important macroeconomic parameter in cloud detection, plays a mean role in weather forecasting, field meteorological service, aerospace and climate researches. Automatic identification of cloud types is not efficiently resolved. Cloud shapes, texture, color, contour, range, process of change and some other features are used for manual cloud classification, but it is hard to find a nice way to extract effective features for automatic identification. Particularly, infrared images provide less resolution and less color information.

A new method is proposed to classify cloud images obtained from the whole sky infrared cloud measuring system (WSIRCMS) from compressive sensing (CS). Firstly, a redundant dictionary is constructed with typical cloud samples. In order to reduce the computational complexity and computing time, principal component analysis (PCA) and down-sampling is applied to dimension reduction in building up redundant dictionary. It’s found that classification results tend to be stable and suitable when the feature contribution rate is more than 95% in PCA or at 16-time down-sampling. Secondly, the optimal solution of paradigm is solved using gradient projection for sparse reconstruction (GPSR) and orthogonal matching pursuit (OMP) algorithms. Sparse algorithm has a certain influence on classification results. There are some negative sparse solutions in GPSR and OMP algorithms, and through the analysis, when the proportion of negative sparse solution is more than 46%, the classification of residual method is prone to error. Sparse solution may be wrong if the incoherence of different type cannot be guaranteed in establishing redundant dictionary, and the dimension reduction may especially increase the correlation. If the cloud texture, structure feature can be kept in process of dimension reduction and one-dimensional treatment and establishing redundant dictionary is complete, it probably makes better sparse solution. Finally, the residual method and sparse proportion method are used to discriminate cloud types. According to experimental results, it’s found that the spare-proportion of wave cloud misclassified as cumuliform is less than cumuliform, and for the wave cloud misclassified as stratus cloud or cirrus, its spare-proportion of stratus and cirrus type is small. By combining two discriminated methods, two greatest sparse proportion types are selected and then the small residual is analyzed. Classification accuracy of wave, cumuliform, cirrus cloud is improved.

Using compress sensing theory in cloud classification avoids the feature extraction process, and provides a new way for the automatic identification of infrared cloud images. With this method, the recognition rate of waveform, stratiform, cumuliform, cirrus and clear sky reaches 75%, 91%, 70%, 85% and 93%, respectively, with the average accuracy up to 82.8%.

infrared images; compress sensing; sparse representation; cloud classification

10.11898/1001-7313.20150211

国家自然科学基金项目(41205125)，公益性行业(气象)科研专项(201206068)

韩文宇，刘磊，高太长,等. 基于压缩感知的地基红外云图云状识别. 应用气象学报，2015，26(2)：231-239.

2014-05-16收到， 2014-11-18收到再改稿。

* email: hwyaiwym@163.com