APP下载

基于灰度共生矩阵与AdaBoost判别法的冰雹预测

2017-03-27李冰洁李国东

中低纬山地气象 2017年1期
关键词:冰雹共生纹理

李冰洁,李国东

(新疆财经大学,新疆 乌鲁木齐 830012)

基于灰度共生矩阵与AdaBoost判别法的冰雹预测

李冰洁,李国东

(新疆财经大学,新疆 乌鲁木齐 830012)

选取新疆地区雹云与非雹云雷达反射率图像进行降雹与无雹天气分析。用中值滤波与九阶拉普拉斯算子处理图像得到图像的纹理信息。用灰度共生矩阵方法提取图像的能量、熵、惯性矩、相关性、逆差矩并提取图像的一、二、三阶颜色矩,将这8个变量进行标准化作为特征数据,利用AdaBoost判别法建立判别分类器,对雹云图像进行分析判别。结果显示该文采用的方法能够明显的区分降雹与无雹云层,判别误差较小,具有参考价值。

拉普拉斯变换;灰度共生矩阵;颜色矩;AdaBoost分类器

1 引言

强对流天气指的是陆地水循环系统中气流扰动造成的对大于17.2 m/s的气流性大风和大于20 mm/h的短时强降水的天气现象。强对流天气往往作用范围小,持续时间短,但是造成破坏力很大,对正常的生产生活有很大影响,由强对流天气而造成的人身以及财产损失的报道屡见不鲜。冰雹是常发的一种强对流天气。

我国是冰雹灾害天气发生较为频繁的国家。数据统计我国每年冰雹灾害损失极高,仅2016年5—9月期间就发生多次冰雹灾害,造成严重损失。如:5月3日河北张家口市的13个县遭受强冰雹灾害,其中造成的农业损失高达5.81亿元,受灾面积达30 648.9 hm2,其中大部分农田绝收;6月23日下午江苏省的盐城遭遇龙卷风、冰雹等强对流天气,造成了严重的人生伤亡,当地的通讯、电力、交通、农业、经济都遭受严重创伤;8月23日22时左右,新疆生产建设兵团第一师阿拉尔市已接近成熟的香梨、红枣等农作物受到严重的毁坏,受灾面积超过1.36万hm2,初步统计的损失为4.76亿元;9月5日罕见冰雹突袭烟台市,冰雹天气持续30 min左右,雹粒有一元硬币大小,据统计仅农作物受损面积高达2 281 hm2,造成直接经济损失4亿多元等。冰雹灾害的发生对农业、建筑业、交通、通讯、娱乐等方面都有影响,且每年由冰雹灾害造成的损失十分严重。所以需要及时的预测预警冰雹的发生。

美国运用名为WSR-88D的冰雹算法(Hail Detection Algorithm,简称HAD) 对冰雹概率(Possibility of Hail,简称POH)、强冰雹概率(Possibility of Strong Hail,简称POSH)及冰雹灾害中的最大预期冰雹直径(Maximum Expected Hail Diameter,简称MEHS),在预防冰雹灾害和减少其带来的损失方面有着突出贡献。我国在冰雹灾害预测领域也有很大成就。王瑾[1]采用GIS分析了贵州省的降雹与地形分布的关系;廖运勋[2]采用低、中频重力波指数对冰雹暴雨进行诊断分析;周金莲[3]等人检验了CINRAD/SA雷达的冰雹识别算法;张秉祥[4]用模糊逻辑对冰雹天气雷达识别;许弋[5]等人采用高空气温压场相似指标算法对冰雹预警方法进项检验。

由于冰雹的形成与积雨云的高度、环境温度、含水量、气流等因素都有关系,国内的研究数据多为云层的高度、温度、厚度,而忽略了云层图像蕴含的信息。本文以新疆地区的雹云图像为基础,利用图像增强技术,灰度共生矩阵,颜色矩与AdaBoost判别来识别降与不降雹的雷达图像。通过验证此方法可有效地区分雹云图像。

2 图像特征提取

2.1 图像增强

图像增强在图像处理中是应用最广、最基本的技术之一,其目的是对研究图像进行有效处理,从而得到视觉效果更好、更适于某个应用处理的图像。图像增强有很多种方法,大致分为两类:空间域和频域两种。在空间域上的图像增强技术是对图像像素对应的灰度值直接进行处理;频域上的图像增强技术则是在某个变换域上对图像进行相应变换。本文先采用中值滤波对图像去除噪声,再用拉普拉斯算子提取图像的边缘信息。

雷达图像在生成和传输过程中因为某些原因容易产生噪声,所以一般在提取图像特征之前应先对图像进行平滑处理,即图像去噪。图像去噪的方法分为线性与非线性滤波两种,在线性滤波的过程中容易丢失图像的某些细节与边缘。所以一般采用非线性滤波。中值滤波是非线性滤波的一种,不仅能够有效的去除图像中所含的噪声而且还能将图像的边缘较好的保留。根据实验对比本文采用3×3模板的中值滤波对雷达云层图像做去噪处理。

图像边缘提取是图像处理中重要的处理过程,常被用于图像数字信息提取,纹理分析等。图像的边缘纹理蕴含了重要的信息。拉普拉斯算子[6]在数学和物理学中运用非常广泛,可以作为一个n维欧式空间的二阶微分的边缘检测算子,有旋转不变性即各方向相同。本文采用的算子为9×9的拉普拉斯边缘检测算子,具体如下:

2.2 图像特征提取

2.2.1 颜色矩(Color Moment) 对于彩色图像而言颜色是最重要的特征之一,其广泛的被用于图像的检索之中。

颜色矩可以明显的表示出彩色图像的颜色分布特征。此方法的特点是:不需要进行颜色空间的量化,从而减少出现误检的概率,得到的图像特征值维数较低,方便运算。包含:一阶矩(图像均值)、二阶矩(图像方差)和三阶矩(图像斜度)等,一般情况下彩色图像的颜色特征分布信息在一、二、三阶的颜色矩中即可呈现,所以一般采用低阶矩来衡量图像的颜色特征,它们的计算方法为:

(1)

(2)

(3)

其中,pi,j为彩色图像中第i个行中第j列的像素的值,N表示为图像像素总个数。

2.2.2 灰度共生矩阵 图像的纹理是一种区域性的特征,描述的是图像各像素之间的空间分布特征。因为图像的特征信息能被纹理特征充分的展现,它是描述图像、分析图像、识别图像的重要依据,所以纹理的提取在目标识别中是非常重要的。图像纹理特征的提取方法有很多,如:基于空间频率、局部统计特性、随机场模型等方法,其中,应用最广泛的是基于灰度共生矩阵的数字纹理特征。

灰度共生矩阵作为分析图象结构的基础,是一个综合信息,反映的是图象的灰度在间隔、不同方向、变化幅度。是在图像纹理模式下像素之间的灰度空间关系,体现了各灰度的空间依赖性。它的元素表示的是图像中的两个灰度像素值i和j,它们之间的距离为d,在某一特定方向下(i,j)这两个像素出现的次数。一般选择0°、45°、90°、135° 4个方向。根据灰度共生矩阵可以得到图像的:能量、熵、共生和熵、共生差熵、对比度、相关、纹理方差、 逆差矩等。本文则选取以下5种典型特征数据作为判别变量。

①角二阶矩(ASM):

(4)

②对比度(CON):

(5)

③相关(COR):

(6)

④熵(ENT):

(7)

⑤逆差距(IDM):

(8)

p(i,j,d,θ)为灰度共生矩阵。

3 Adaboost方法以及实现[10-11]

3.1Boosting方法

在实际中只用一个模型来判别一组数据的分类是不明智的,如果用一个模型来清晰地判别数据会非常复杂,对模型的精准性要求也较高,这样就引出组合模型的概念。组合模型的基本原理是:用现有的一些方法建立一些识别率不高的回归模型或弱分类器,再将这些准确率不高的模型结合起来,组成一个新的整体分类体系达到改善模型识别率的效果。Boosting是这类方法的典型。

Boosting方法通过构造一组预测函数,然后将这组预测函数以一定的方式组合成一个整体函数。Boosting方法思想就是:将其他的弱分类器作为基础,放于Boosting方法中处理训练样本,得到不同的训练样本子集,用所得的样本子集生成新的基分类器。n个样本集就会有n个基分类器产生。每个基分类器反复调整误判数据的权重,进行加权融合,最终用投票方法(voting)产生一个预测模型:

(9)

得到的n个基分类器,每个分类器的识别率不一定很高,但用Boosting方法将他们联合后的结果的识别率大大提升。Boosting算法有很多种本文采用Adaboost算法。

3.2Adaboost算法

Boosting算法中最具代表性的算法之一就是AdaBoost,这种算法对基分类器的识别率的要求不是很高。AdaBoost算法的核心任务就是把容易的,识别率低的弱分类算法提升为强分类算法,以此来提高模型的识别率。

Adaboost算法步骤(以两类为例):

①输入训练样本数据。(x1,y1),(x2,y2),…,(xn,yn)。其中xi表示待分类样本各特征数据组成的向量,yi表示该分类样本的类别标签。本文中每个xi是一个八维的向量(x1,x2,…,x8),yi∈{-1,1}。

③令t=1,2,…,T

在Wt下选出样本数据,得到不同的弱分类器ht:X→{-1,1}。

计算所得的分类器的误差:

计算每个分类器的权重:

更改训练样本的权重:

Wt+1(i)=Wt(i)e-αtyiht(xi)/Zt

其中Wt(i)表示第t次迭代时的样本权值向量,Zt为归一化因子。

3.2Adaboost判别法的实现与检验

本文选取新疆地区气象雷达探测的云层图像,利用拉普拉斯边缘提取技术提取云层图像的边缘特征,再提取图像的灰度共生矩阵中的5个特征值,并提取一、二、三阶颜色矩,把这8个变量的数据标准化求其均值,作为特征数据库,在数据库中随机选取30组数据用Adaboost判别法分类。如表1,其中分类1代表降雹为第1~10组数据,分类2代表无雹为第11~20组数据,将这20组数据作为判别的基准类生成判别器,对待测样本第21~30组进行分类(其中前5组为降雹后5组为无雹)。

表1 训练样本

将数据导入分类器,得出前5组均为无雹,后5组均为降雹。判别均正确。

由于数据选取的判别基准数据较少仅20组,AdaBoost分类器判别形成的组合分类器的准确率可能存在偶然性,所以在数据库中另外在随机选取60组数据作为基准类来判别,对样本重新训练检验AdaBoost组合分类器方法的有效性。

表2 检验样本

检验结果与表1的一样,即在输入的训练样本较多的情况此方法所建立的分类器仍然有较高的准确性,说明本文采取的组合分类器的方法具有普适性。

4 结论

目前冰雹灾害的预测主要分为短期预测和短临预测。短期预测是指通过气象探测手段来收集各种天气要素导入至程序中,以计算推测天气变化的趋势,以某些特定要素(例如云层中产生冰雹的概率,温度对数压力系数,风廓线图等等)的变化作为冰雹灾害发生和强度预测的根据。用此方法,冰雹灾害于何时降临何地,灾害达到何种程度这些数据的获得依赖于预测模型选取,不同的模型对预测结果影响比较大。短临预测主要利用多普达雷达、气象卫星等观察对流层的气流变化。气象雷达发射雷达波对雷达进行扫描,回收诸如反射率因子、组合发射率、回波顶高、平均径向速度等数据。同短期预测相比,虽然短临预测提高了冰雹灾害预测的精度,基本可以精确判断冰雹灾害发生的时间、区域和强度,但是牺牲了时效性,对于防灾救灾工作的开展还是有很大制约作用。

如以上介绍的两种方法,气象局所应用的天气系统都是利用雷达探测的直接数据建立数据库进行分析,对云层反射率图像的分析较少,如果直接对天气雷达所获取的数据进行分析,分析因子就会局限在温度,湿度,地表温度等外在条件,而忽略云层的内因,在分析由相似外因形成的极为相近的天气系统中容易产生误判。因此判别样本库的建立是提高判别准确率的有效途径。

本文通过新疆自治区气象局提供的2009—2010年的气象雷达反射率图像中,选取资料,利用拉普拉斯变换和中值滤波对图像增强,得到图像的纹理信息,计算图像的灰度共生矩阵的特征值获取纹理特征数据,且求得图像的颜色特征数据一、二、三阶颜色矩,由这些数据构成判别分析中的训练样本。判别分析法中选取Adaboost判别法建立分类器进行实际数据检验。检验结果表明,分类器判别的准确性较高,可以实现利用反射率图像对雹云的识别,对气象雷达云图处理方法有一定的参考价值。

[1] 王瑾,刘黎平.基于GIS的贵州省冰雹分布于地形因子关系分析[J].应用气象学报,2008.10.

[2] 廖云勋,周明,张先俊.中尺度重力波指数与暴雨冰雹等强对流天气的关系[J].贵州气象,2010.9.

[3] 周金莲,钟敏,等.CINRAD/SA雷达的强冰雹识别算法进行检验[J].暴雨灾害,2012.12.

[4] 张秉祥,李哲,刘黎平,等.基于模糊逻辑的冰雹天气雷达识别算法[J]. 应用气象学报,2014.7.

[5] 许弋,孙涛,张平.基于相似指标法的贵州春季冰雹预警方法的检验[J]. 贵州气象报,2012.10.

[6] 卢允伟,陈友荣.基于拉普拉斯算法的图像锐化算法研究和实现[J].电脑知识与技术,2009,5(6):1513-1515.

[7] 高志忠.基于灰度共生矩阵的织物纹理分析[J].计算机工程与设计,2008.8.

[8] 焦蓬蓬,郭依正,刘丽娟,等. 灰度共生矩阵纹理提取的Matlab实现[J].计算机技术与发展,2012-11.

[9] 陈超等.MATLAB应用实例精讲—图像处理与GUI设计篇[M]. 北京:电子工业出版社,2011.

[10]王斌会.多元统计分析及R语言建模[M]. 广州:暨南大学出版社,2011.

[11]王星,褚挺进.非参数统计[M].北京:清华大学出版社,2015:268-271.

Hail prediction based on gray level co-occurrence matrixand AdaBoost discriminant analysis

LI Bingjie,LI Guodong

(School of Applied Mathematics, Xinjiang University of Finance and Economics, Urumqi 830012, China)

Xinjiang region hail cloud and non-hail cloud radar reflectivity image were selected for analysis. The texture information of the image was processed by median filter and nine order Laplasse operator. Gray level co-occurrence matrix method was adopted to extract the energy, entropy, moment of inertia, correlation, inverse moment of the image, and The first, second and third order color moments of the image were extracted and the eight variables were normalized as feature data. AdaBoost method was used to establish discriminant analysis discriminant classifier, identification of hail cloud image. The results show that this method can obviously distinguish between hail and hail clouds; discriminant error is small, with a reference value.

Laplasse transform; gray level co-occurrence matrix; color moment; AdaBoost classifier

1003-6598(2017)01-0035-05

2016-09-21

李冰洁(1991—),女,在读硕士,主要从事数据挖掘与图像处理工作,E-mail:295685112@qq.com。

P457

B

猜你喜欢

冰雹共生纹理
小诸葛漫“话”天气之冰雹
人与熊猫 和谐共生
共生
基于BM3D的复杂纹理区域图像去噪
优生共生圈培养模式探索
优生共生圈培养模式探索
使用纹理叠加添加艺术画特效
冰雹的优点
TEXTURE ON TEXTURE质地上的纹理
春日冰雹