基于图像熵的卫星云图分类方法
2012-01-16黄勇张文建郁凡
黄勇,张文建,郁凡
(1.南京信息工程大学,江苏南京210044;2.安徽省气象科学研究所,安徽合肥230031;3.南京大学,江苏南京210093)
0 引言
气象卫星是监测降水、降雪、冰雹等天气现象的有效手段之一(张晰莹和王承伟,2007;纪晓玲等,2010;王蕾等,2011;翟菁等,2011)。20世纪70年代,Barrett(1970)就开始利用每日一次的云图资料估计降水量。之后,国外许多学者都在这方面开展了卓有成效的研究工作,逐渐形成“云指数法”(Adler and Mack,1984;陈渭民等,1995)和“生命史法”(Gfrith et al.,1978;Stout et al.,1979;中村和信和土屋乔,1985;Alder and Negri,1988)两类基本的降水估算方法,并逐步将地面观测、天气雷达等资料以及聚类、小波分析和神经网络等新技术运用其中(师春香等,2001a,2001b;郁凡,2003;阿迈德等,2004;桂海林和郁凡,2004;潘永地和姚益平,2005;李伟钢等,2006)。
由于红外/可见光通道仅能观测到云顶的信息,在降水监测过程中,主要通过相关的模型方法,来推算地面降水量。而降水机制(暖云降水、冷云降水、混合性降水)的差异,会导致云顶信息与地面降水间关系的不同。因此,在卫星降水估算中,有必要先进行云的分类,之后再针对不同的云类型来设计估算模型,以提高精度。
云分类主要根据云的特性和形成过程来进行类别划分,通常考虑的几个因子是:云的外观、高度、形成过程和云粒子组成等。20世纪70年代Koffler et al.(1973)就开始采用阈值方法,来进行云和地表的划分。随着气象卫星通道信息的不断丰富,多光谱阈值法得到了广泛应用。周伟和李万彪(2003)利用GMS-5红外多通道亮温资料进行云分类,准确率接近70%。杨澄等(2002)将模式预报结果与多谱阈值法相结合,能较准确地在GMS-5卫星云图上区分云与晴空,判别出高云和低云。另外,在固定阈值分类方法的基础上,还发展出了动态阈值法和综合阈值法,以提高分类的精度(谭永强等,2009;王昌雨等,2011)。
除采用简单的阈值判别来进行分类外,聚类方法、神经网络、图像分析和人工智能等技术方法逐渐应用到分类中。近20 a,聚类方法在卫星云分类和降水估算中得以广泛应用,并不断地加以完善(Adler and Negri,1988;杨扬和戚建国,1996;王立志等,1998;洪梅等,2005,2006;尹跃等,2009)。而基于模仿生物大脑的结构和功能而构成的神经网络技术,在卫星云图分类中应用的历史,也可追溯到20世纪80年代末(Key et al.,1989)。许多研究都表明,神经网络技术是进行云客观分类的一种有效的分类方法(师春香等,2001a,2001b;师春香和瞿建华,2002;Wang et al.,2004;陈刚毅等,2005;张韧等,2006)。随着图像处理技术的广泛应用,费文龙等(2007)提出了基于核心灰度的Mumford-Shah模型的云图划分方法,对两个通道的卫星云图进行分割,能够更准确地识别出中低云系。郑君杰等(2005)则将图像处理分析与人工智能技术两者相结合,进行纹理特征分析,并结合神经网络技术进行云类的识别实验,证明了这种方法的有效性。
在众多方法中,聚类方法、神经网络、图像分析和人工智能等技术均需要掌握许多数理和图像处理方面的专业知识。而阈值法则是一种原理通俗易懂,无需专业知识为基础的分类技术。并且由于阈值法具有一定准确率,使得该方法在实际工作中得以广泛应用。但是,阈值法中的阈值标准不具有普适性,具体的阈值会随着地域、卫星传感器以及季节的不同而出现差异。因此,如何有效地确定阈值标准,是阈值法的一个关键。
本文针对阈值的不确定性,结合与降水量间有较好对应关系的图像熵这个纹理特征量(寿亦萱等,2005),采用图像自动分割技术——Kapur方法(Kapur et al.,1985),在统计自动分类阈值的基础上,来建立云图的分类方法,并在2007年7月1—5日淮河流域的暴雨过程中进行应用检验。
1 方法介绍
阈值分类法,就是通过从图像信息中选择一个或多个特征阈值,将图像分成两类或多类。Kapur方法是一种基于熵的经典方法,对于简单的两类划分问题,该方法通过优化如下的准则函数来选择相应的阈值:
其中:Hf(T)和Hb(T)分别表示目标和背景类包含信息量的大小(熵);p(g)表示图像所有像素中灰度级为p的像素点所占的比例;P(T)表示累加概率,即灰度级从0到T的像素点所占总像素数目的比例;G代表最大可能的灰度级,即图像具有256个灰度级时,G=255。
在两类分割公式的基础上,可以推导出k类划分问题的公式:
在确定分类数目k的情况下,计算所对应k-1个阈值组合的函数值,选择当目标函数最大化时的k-1个阈值,作为分割阈值。在具体的方法实现过程中,采用了MATLAB本身所含的优化函数fminsearch来进行。
考虑到在FY2C业务产品中,分8个类别来进行云图划分,而其中有两个类别均包含有2种云型(国家卫星气象中心,2006)。因此,在自动分类中,首先,假设分类数k从2到10变化,并计算出每种分类数目下对应的阈值;其次,求出最佳分类数;而后,根据自动确定的最佳分类数,找出其对应的阈值,作为最终的分类阈值;最后,对多个时次云图分类数目和阈值的概率分布进行统计分析,选取出现频率最大的分类数目和阈值概率分布的峰值为标准,来进行阈值分类。
2 个例概况与卫星云图处理
2007年淮河流域发生了自1954年以来的流域性大洪水,从2007年6月30日开始,副热带高压开始增强控制长江以南大部分地区,中低层切变维持在淮河流域,受中高纬度西风槽及中低层切变的共同影响,流域出现持续性强降水过程。
在云图处理方面,对逐小时FY2C卫星的红外通道亮温信息进行投影变换和灰度转化两个方面的处理。1)采用等经纬度(0.05°×0.05°)投影(范围:80~130°E,45~15°N)方法进行区域卫星资料的重采样。2)限定研究区域内云系的亮温变化区间为(165 K,290 K),根据公式G=255-(T-165)×2,进行亮温T与云图上像素点灰度值G之间的转换,生成相应的卫星云图。
3 应用分析
采用Kapur方法对2007年7月1—5日FY2C云图进行自动分割。由图1可见,划分为10类的频率最大(占到了45%),即将云图自动划分为10种类别的时次最多。对应的概率分布曲线(图2)表明,不论何种步长,均出现了9个明显的峰值,说明在峰值附近小区间内的阈值出现概率较大。这正好与自动将云图划分成10类频次最高相呼应。即可以在9个峰值附近选取阈值,来将云图划分为10类(具体的阈值选用1 K步长概率曲线的9个峰值)。
图1 分类类别数目的概率分布Fig.1 Probabilities of different classification numbers
由于GOES气象卫星使用手册中已有增强显示对流系统的处理方法(NESDIS/NOAA,1983),处理曲线如图3所示,由此可以提取增强处理的8个亮温阈值(GOES阈值)来进行云图的分类。考虑到273 K为冰—水相态变化的转折点,而在云图预处理中已将亮温高于290 K的区域认为是非云区,因此在GOES阈值中增加273 K这一阈值,并去除高于290 K的阈值。在应用检验过程中,将利用Kapur方法所建立的阈值(新亮温阈值)与GOES阈值进行对比(表1)。可以看出,两阈值总体上较接近。为分析阈值分类与地面降水的关系,分别统计各云层中不同等级降水(小雨:0.1~2.5 mm/h;中雨:2.6~8.0 mm/h;大雨:8.1~15.9 mm/h;暴雨:≥16 mm/h)出现的概率。为便于比较,将新阈值结果中的10个分层压缩成9个(云层3和云层4合并成一个)。
图2 1 K(a)、2 K(b)、3 K(c)、4 K(d)温度步长的TBB阈值概率分布Fig.2 Probabilities of TBB thresholds of(a)1 K,(b)2 K,(c)3 K,and(d)4 K temperature spans
图3 云图多阈值曲线增强示意图(取自《GOES使用手册》(NESDIS/NOAA,1983))Fig.3 Infrared enhancement curve of GOES(from GOES User’s Guide(NESDIS/NOAA,1983))
表1 红外1通道分层的TBB值Table 1 TBB values of different layers in IR1 cloud image
GOES阈值的云类划分结果(表2)中,云层1和2均以无雨为主,比例分别为98%和96%,仅有零星小雨出现。云层3虽仍以无雨为主(占85%),但是小雨比例已上升到13%,并出现了小范围(2%)的中雨。云层4中无雨的比例减小到66%,而小雨和中雨分别占24和9%,且出现少量(1%)大雨。云层5~9中各种等级的降水均有发生,但存在无雨比重最大、随雨强增大而比例减小的特点。
表2 GOES阈值结果中各云层中不同等级降水的比例Table 2 Probabilities of various precipitations in different cloud layers by GOES enhance thresholds
新阈值结果中,各雨强在云层中的分布特征(表3)与GOES阈值(表2)相近,只是在具体的数值上有所差异。
表3 新阈值结果中各云层中不同等级降水的比例Table 3 Probabilities of various precipitations in different cloud layers by new criterion thresholds
1)从无雨比重的分布来看,在云层4处,GOES阈值结果中无雨的比重要小于新阈值,即具有更大的降水概率;在云层8中,这种差异正好相反,新阈值结果中无雨的比重降到最低,仅为35%,而GOES阈值结果中虽然也降到了最低,但比重却有42%。
2)从各云层小雨出现概率的分布可以看出,两阈值结果仅在云层4、5和8存在差异。新阈值划分出的云层4和8中出现小雨的概率大于GOES阈值,而在云层5中却正好相反。中雨出现概率仅仅在云层8中存在差异,新阈值的比例偏高。
3)在大雨和暴雨出现概率的分布上,两阈值的规律总体相近,均随亮温的降低呈单调上升的变化。仅在云层7处存在明显差异,新阈值的概率大。
上述分析表明,两种阈值在该过程中区分降水的效果相当,也就是说虽然阈值有小的差异,但对降水有着相同的指示意义。
图4给出了各云层不同等级降水的概率变化。可见,与总体的变化趋势有所不同,云层9中无雨的比重要大于云层8。即虽然云层9的云顶亮温更低,但是降水概率却要小一些。也就是说,当亮温达到某一界限值时(191 K左右),降水概率随着云顶亮温降低而增加的变化趋势开始出现转折,开始随亮温降低而降低。这一现象存在两个可能因素:1)与降水类型和云体的发展有关,层状云相对稳定,云顶亮温不会太低,而当亮温达到191 K附近时,一般代表的是对流云。当对流云发展旺盛时,上升气流较强,云顶高度高,亮温低。此时,虽然上升气流区云顶亮温很低,但是由于云中以上升气流为主,不利于降水的发生,降水发生的概率降低。2)这一区间高层卷云的存在对降水识别造成一定影响,高层的卷云虽然云顶亮温很低,但是却不会产生降水。由于分析的是淮河流域的夏季暴雨过程,因此主要以对流性降水为主,故因素1为造成这一异常的主要原因。
4 结论与讨论
本文介绍了一种利用Kapur方法进行自动分割云图,并通过统计分析来确定云图分类阈值的卫星云图分类方法。从2007年7年初暴雨过程应用检验的结果来看,该方法得到的分类阈值与美国GOES卫星使用手册中对流系统的增强显示阈值之间虽然存在着一定的差异,但对降水的指示意义却存在着相近的规律。
根据两阈值以及各云层中出现最多的降水等级,制作降水等级落区分布图(图5a),将图中云顶亮温低于290 K的变化轴(横坐标)划分为7个区间。
区间1为290~273 K。在该区间内只可能发生小雨量级的降水。
图4 各云层不同等级降水的概率变化a.无雨;b.小雨和中雨;c.大雨和暴雨Fig.4 Probabilities of various precipitations in different cloud layersa.no rainfall;b.light rain and moderate rain;c.heavy rain and storm rainfall
图5 不同降水等级发生区间图a.两阈值独立划分;b.两阈值综合划分Fig.5 Relationship of rainfall and cloud top temperaturea.classification with all thresholds in Table 1;b.classification with synthetical thresholds
区间2为273~266 K。如果采用GOES阈值则该区间为中等降水发生区,而根据新阈值,该区间则仅属于小雨发生区域,并不会产生中雨等级的降水。因此,区间2为小雨发生区,不会发生中雨等级的降水。
区间3为266~245 K。此为新阈值中云层3A和3B所处区段,这一区间内能够发生小雨与中雨等级的降水。
区间4为245~241 K。在两阈值中,此云层均为开始出现大雨的云层,由于GOES阈值中上界阈值低,因此可以认为新阈值245 K偏大,区间4应该为小到中雨发生的云层,而不会发生中雨以上强度的降水。
区间5为241~230 K。在两阈值中,该区段内的云层均有大雨等级的降水产生,因此该区间为小到大雨发生的区间。
区间6为230~223 K。在两阈值中,该云层均为开始出现暴雨的云层,由于新阈值的上界阈值低,因此可以认为GOES阈值的标准230 K偏大,区间6应该为小到大雨发生的云层,而不会发生大雨以上强度的降水。
区间7为小于223 K。在两阈值中,该区段内的云层均有暴雨量级的降水产生,因此该区间为所有等级降水的发生区间。
综上可见,对于2007年7年初暴雨过程来说,区间290~266 K仅会发生小雨,266~241 K会发生小到中雨,241~223 K会发生小雨、中雨和暴雨,而当亮温低于223 K时则可能发生所有等级的降水(图5b)。
总的来说,在Kapur法自动分割云图基础上,通过统计来确定云图阈值分类方法中的阈值,是一种可行的技术思路,且分类结果与地面实况降水之间有着较好的对应关系。这也说明,该方法能够在卫星估算降水过程中增强对不同类型降水的识别能力,是一种有效的卫星云图分类方法。
阿迈德·迪狄安·迪阿罗,刘晓阳,毛节泰,等.2004.卫星雷达联合重构大尺度流域降水场[J].高原气象,23(1):11-17.
陈刚毅,丁旭羲,赵丽妍.2005.用模糊神经网络自动识别云的技术研究[J].大气科学,29(5):837-844.
陈渭民,刘雅芳,郁凡.1995.利用静止气象卫星资料估算青藏高原降水的初步探讨[J].南京气象学院学报,18(3):433-438.
费文龙,吕红,韦志辉.2007.基于Mumford-Shah模型的卫星云图分割方法[C]//全国第18届计算机技术与应用(CACIS)学术会议.宁波:1272-1278.
桂海林,郁凡.2004.用神经网络进行多波段卫星信息的降水估测[J].气象科学,24(2):177-184.
国家卫星气象中心.2006.风云二号C卫星业务产品释用手册[R].61-66.
洪梅,张韧,万齐林,等.2005.模糊聚类与遗传算法相结合的卫星云图云分类[J].地球物理学进展,20(4):1009-1014.
洪梅,张韧,孙照渤.2006.多光谱卫星云图的高维特征聚类与降水天气判别[J].遥感学报,10(2):184-190.
纪晓玲,冯建民,穆建华,等.2010.宁夏北部一次短时暴雨中尺度对流系统的特征分析[J].大气科学学报,33(6):711-718.
李伟钢,Ramirez M C V,Ferreira N J,等.2006.气象卫星云图的多分辨小波分解及人工神经网络降水估计研究[J].南京气象学院学报,23(2):277-282.
潘永地,姚益平.2005.地面雨量计结合卫星水汽通道资料估算面降水量[J].气象,30(9):28-30.
师春香,吴蓉璋,项续康.2001a.多阈值和神经网络卫星云图云系自动分割试验[J].应用气象学报,12(1):70-78.
师春香,卢乃锰,张文建.2001b.卫星面降水估计人工神经网络方法[J].气候与环境研究,6(4):467-472.
师春香,瞿建华.2002.用神经网络方法对NOAA/AVHRR资料进行云客观分类[J].气象学报,60(2):250-255.
寿亦萱,张颖超,赵忠明,等.2005.暴雨过程的卫星云图纹理特征研究[J].南京气象学院学报,28(3):337-343.
谭永强,费建芳,石汉青.2009.基于多种底图的云检测[J].气象科学,29(1):52-57.
王昌雨,孔玉寿,强学民,等.2011.地球同步卫星资料的一种云地分离综合处理技术[J].气象科学,31(1):40-45.
王蕾,黄慰军,黄镇,等.2011.新疆两次暴雨过程云系的MODIS三光谱特征分析[J].气象科学,31(1):107-112.
王立志,李俊,周凤仙.1998.GMS-5四通道云图的自动分类及其在定量降水估算中的应用[J].大气科学,22(3):371-378.
杨澄,袁招洪,顾松山.2002.用多谱阈值法进行GMS-5卫星云图云型分类的研究[J].南京气象学院学报,25(6):274-254.
杨扬,戚建国.1996.数字卫星云图估算面雨量的应用试验[J].气象,21(3):35-39.
尹跃,李万彪,姚展予,等.2009.利用FY-2C资料对西北太平洋海域云分类的研究[J].北京大学学报:自然科学版,45(2):257-262.
郁凡.2003.多光谱卫星图像降水强度场的分析[J].气象学报,61(3):334-345.
张韧,王彦磊,刘巍,等.2006.自组织与概率神经网络优化的卫星云图云类判别[C]//第六届世界自动化智能控制会议文集.济南:41-45.
张晰莹,王承伟.2007.高纬地区罕见的MCC卫星云图特征分析[J].南京气象学院学报,30(3):390-395.
翟菁,黄勇,胡雯,等.2011.强对流系统中对流云合并的观测分析[J].气象科学,31(1):100-106.
郑君杰,黄峰,张韧,等.2005.基于纹理与分形理论的气象卫星云图目标物识别[J].气象科学,25(3):244-248.
中村和信,土屋乔.1985.由日本GMS的空间平均资料推定降水量[J].天气(日),32(10):505-572.
周伟,李万彪.2003.利用GMS-5红外资料进行云的分类识别[J].北京大学学报:自然科学版,39(1):83-90.
Adler R F,Mack R A.1984.Thunderstorm cloud height-rainfall rate relations for use with satellite rainfall estimation techniques[J].J Climate Appl Meteor,23:280-296.
Adler R F,Negri A J.1988.A satellite infrared technique to estimate tropical convective and stratiform rainfal1[J].J Appl Meteor,27(1):30-51.
Barrett E C.1970.The estimation of monthly rainfall from satellite data[J].Mon Wea Rev,98(2):322-327.
Gfrith C G,Woodley W L,Grube P G,et a1.l978.Rain estimation from geosynchronous satellite imagery——Visible and infrared studies[J].Mon Wea Rev,106(8):ll53-ll71.
Kapur J N,Sahoo P K,Wong A K C.1985.A new method for gray-level picture thresholding using the entropy of the histogram[J].Computer Vision,Graphics,and Image Processing,29(3):273-285.
Key J,Maslanik J A,Schweiger A J.1989.Classification of merged AVHRR and SMMR arctic data with neural networks[J].Photogrammetric Engineering and Remote Sensing,55(9):1331-1338.
Koffler R,DeCotiis A G,Rao P K.1973.A procedure for estimating cloud amount and height from satellite infrared radiation data[J].Mon Wea Rev,101(3):240-243.
NESDIS/NOAA.1983.The GOES User's Guide[R].
Stout J E,Martin D W,Sikdar D N.1979.Estimating GATE rainfall with geosynchronous satellite images[J].Mon Wea Rev,107(5):585-598.
Wang J,Azimi-Sadjadi M R,Reinke D.2004.A temporally adaptive classifier for multispectral imagery[J].IEEE Transactions on Neural Networks,15(1):159-165.